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第 一 章 ”现代 分 析 化 学 与 分 析 信 息 理论 和 方法 
第 一 节 ”现代 分 析 化 学 一 一 化 学 量 测 与 化 学 信息 的 新 兴学 科 


分 析 化 学 学 科 正经 历 着 巨大 的 变革 ,由 于 近年 来 物 埋 学 和 电子 学 的 发 展 , 各 种 新 型 分 
析 仪 器 相继 问 址 ， 昔 日 的 以 化 学 分 析 为 主 的 经 典 分 析 化 学 已 发 展 成 为 -- 门 包括 众多 仪器 分 析 
《色谱 分 析 , 电化 学 分 析 ， 光化学 分 析 , 波谱 分 析 ， 质 谱 分 析 , 热 分 析 , 放射 分 析 ， 表面 分 析 . 
等 ) 为 主 的 现代 分 析 化 学 。 正 因为 分 析 手 段 的 不 断 扩展 ， 广 大 分 析 化 学 家 们 感到 以 “溶液 平 
筑 ” 为 基础 的 经 典 分 析 化 学 已 不 能 代表 现代 分 析 化 学 学 科 发 展 的 全 狐 . 致使 Leihaisky 提出 的 
“不 管 你 喜欢 不 喜欢 ， 化 学 正在 走出 分 析 化 学 ”的 论点 广 为 流 传 。 分 析 化 学 界 出 现 了 “化 学 正 
在 走出 分 析 化 学 ”, 分 析 化 学 应 重 名 为 “分析 物理 ”, "分 析 科 学 ”的 议论 ,1985 年 11 月 和 1989 年 
10 月 在 维也纳 分 别 召 开 了 第 一 次 和 第 二 次 “国际 分 析 化 学 的 哲学 和 历史 会 议 ”, 探讨 分 析 化 学 
的 某 些 基本 哲学 问题 。 这 说 明 分 析 化 学 学 科 正 处 在 一 个 急剧 分 化 的 发 展 时 期 。 美 国 《分 析 化 
学 》 的 主编 Murray 在 题 为 “化 学 量 测 科学 ”一 文中 指出 :“ 用 拓展 的 眼光 来 看 待 今天 的 分 析 
化 学 是 有 益 和 有 帮助 的 ， 它 的 发 展 已 使 之 成 为 一 门 创造 和 应 用 新 概念 、 新 原理 和 仪器 的 策略 
来 测量 化 学 体系 及 其 组 分 的 学 科 , 简 言 之 , 分析 化 学 已 成 为 一 门 化 学 量 测 科学 OOM 
循 着 “分 析 化 学 是 一 门 化 学 量 测 科学 ”的 恩 路 .就 可 以 发 现 ， 分 析 化 学 学 科 当今 的 变革 不 是 
“化 学 正在 走出 分 析 化 党” 面 是 “物理 和 新 仪器 止 在 走 进 分 析 化 学 ”, 它 使 分 析 化 学 家 手中 拥 
有 更 多 的 化 学 量 测 工具 和 手段 ， 为 分 析 化 学 家 解决 各 学 科 发 展 所 需 解决 的 复杂 的 分 析 难题 提 
供 了 更 有 力 的 武器 。 如 何 更 有 效 地 使 用 和 发 展 这 些 新 的 分 析 手 段 和 工具 ， 怎 样 有 效 地 从 这 些 
新 的 化 学 量 测 工 具 和 手段 中 获取 化 学 家 们 所 需 的 有 关 的 化 学 组 成 和 结 均 信息 、 以 及 其 他 各 种 
有 用 的 化 学 信息 ， 当 是 目前 分 析 化 学 家 急需 解决 的 一 个 新 问题 。 

首先 ， 让 我 们 来 考察 一 下 化 学 量 测 的 全 过 程 。 化 学 量 测 的 全 过 程 似 应 从 选择 分 析 方法 和 
采样 开始 ， 经 化 学 量 测 的 试验 设计 、 量 测 过 程 的 正确 控制 和 优化 、 分 析 仪 器 所 得 信号 的 预 处 
理 、 各 类 分 析 仪 器 数据 定性 定量 分 析 ， 表 到 分 析 结 果 的 统计 推断 、 分 折 过 程 机 理 研究 、 所 得 
纯 组 分 波谱 图 的 结构 解析 等 ， 直 至 有 用 决策 信息 的 提取 ， 由 此 看 来 ， 化 学 基 测 过 程 是 一 个 很 
复杂 而 且 内 涵 极 其 丰富 的 过 程 ， 它 每 一 步 的 有 效 完成 实际 都 包括 了 相当 丰富 的 内 容 ， 需 要 有 
很 多 关于 化 学 、 数 学 和 物理 的 基础 知识 。 如 果 说 经 典 的 分 析 化 学 主要 是 以 “溶液 平衡 ”为 基 
础 的 话 ， 那 么 ， 现 代 分 析 化 学 则 是 一 门 包括 如 何 有 效 地 进行 各 种 化 学 试 样 的 处 理 ( 包 括 分 离 
等 化 学 基础 )、 各 种 有 关 分 析 仪 器 所 需 的 物理 知识 (物理 基础 ) 和 化 学 知识 (如 各 种 波谱 解 
ED. 以 及 怎样 进行 最 优 采样 . 实验 设计 或 选择 最 优化 学 量 测 方法 , 并 通过 解析 化 学 量 济 数据 
以 最 大 限度 地 获取 化 学 及 其 相关 依 息 〈 数 学 基础 ) 的 一 门 综合 性 极 强 的 化 学 分 支 学 科 。 

进行 化 学 量 测 的 基本 目的 是 获取 有 关 物 质 系统 的 化 学 成 分 与 结构 方面 定性 与 定量 的 信 
息 。 MEN Kaiser) 在 有 关 分 析 方 法 基础 的 专著 中 ”界定 分 析 化 学 学 科 的 内 涵 为 取得 所 研 
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究 的 物质 组 成 的 知识 的 有 计划 的 信息 过 程 。 EPR (Kateman) 387 MEA RS 
的 任务 : 利用 已 有 的 分 析 方法 ， 提 供 关于 物质 化 学 成 分 的 信息 一 - 日 常 例 行 分 析 工 作 : 研究 
利用 不 同学 科 的 原理 、 方 法 取得 有 关 物 质 系 统 的 相关 化 学 信息 的 过 程 ”一 分 析 化 学 的 科学 猎 
究 工 作 ; 研 究 利 用 现 有 分 析 方 法 到 得 关于 物质 系统 的 人 策略 -一 -分 析 实 验 的 组 织 工作 . 柯 
瓦尔 斯 基 (Kowalski) 在 一 篇 题 为 “分 析 化 学 作为 信息 科学 ”的 论文 中 六 ,指出 分 析 化 学 发 展 
史 正 经 历 极为 重要 的 时 期 。 这 个 时 期 对 分 析 化 党 党 科 的 重要 性 ， 是 与 现代 科学 与 社会 发 后 的 
一 系列 重大 变化 相关 联 的 。 这 种 重大 变化 首先 源 于 计算 机 科学 与 信息 科学 的 发 展 。 该 文 援引 
美国 科学 基金 会 的 报告 ， 认 为 信息 已 成 为 美国 社会 的 极 重要 纽 成 部 分 ， 约 半数 的 劳动 妨 从 事 
与 信息 相关 的 工作 , 挣 取 一 半 以 上 的 劳动 收入 。 在 这 样 一 个 信息 具有 如 此 重要 地 位 的 社会 中 
分 析 化 学 起 什么 作用 ? BRAN. 分析 化 学 现在 是 , 而 且 过 到 也 一 站 是 一 门 信 息 科学 .在 
化 学 的 各 个 分 支 学 科 中 ， 分 析 化 学 担负 的 任务 与 其 他 分 支 学 科 的 不 同 处， 就 在 于 分 析 化 学 的 
研究 对 象 ， 不 是 直接 提供 某 种 具体 的 例如 无 机 和 有 机 材料 ， 而 是 提供 与 这 些 材料 的 化 学 成 分 
DA kap uiapa 
куттун, эн REI oo deti otiam, 不 但 分 析 化 学 与 
机 化 学 、 有 机 化 学 等 传统 的 化 学 分 支 学 科 关 系 如 此 ， 分 析 化 学 与 тынша TUAE 
化 学 的 关系 亦 是 如 此 。 例如， 在 IUPAC30 局 学 术 大 会 上 关于 “环境 的 挑战 ”的 学 术 讨 论 中 ， 
出 现 这 样 的 学 术 报告 题目 : “分 析 数 据 的 生物 学 意义 -一 所 有 环境 课题 都 源 于 分 析 化 学 
家 ! 汪 。 将 分 析 化 学 认 作 通 过 化 学 量 测 取得 化 学 信息 的 科学 .并 不 是 说 分 析 化 学 发 展 到 今天 才 
具有 这 种 人 性 质 ， 也 并 不 完全 是 由 于 信息 对 当代 社会 的 重要 性 ， 人 们 才 有 意 强 调 这 一 事实 Ж 
而 ， 在 分 析 化 学 得 到 飞速 发 展 的 今天 ， 和 人 人 
的 科学 这 一 性 质 , 反映 了 分 析 化 学 的 新 发 展 , TA. 这 一 新 发 展 可 能 还 是 质 的 飞 既 . 那 就 是 、 
分 析 化 掌 工 作者 已 不 仅 是 单纯 的 分 析 数 据 的 提供 者 ， ваннаи B l, 
供 者 。 
值得 提出 的 是 ， 近 年 来 随 着 计算 机 ,特别 是 微型 计算 机 大 量 进 入 化 学 特别 是 分 析 化 学 
验 室 ， 一 门 新 的 化 学 分 支 学 科 ~ 一 化 学 计量 кет. СН Ее 
ВИ, ЗЕ ЕНЕ Т MUU. EU ЗЕ E 112 Ер, EME. Ж 
计 学 与 计算 机 科学 的 工具 和 手段 及 其 最 新 成 果 来 设计 或 选择 最 优化 学 量 册 方法， 并 通过 解析 


化 学 量 测 数 据 以 最 大 限度 地 获取 化 学 及 其 相关 信息 ， 自 然 ， 它 首先 就 在 分 析 化 学 中 得 到 了 普 
ii. B 20 世纪 70 年 代 中 期 诞生 以 来 ， 在 20 世纪 80 年 代 得 到 长 足 发 展 ， 至 今 已 逐步 日 
趋 成 熟 。 图 1-1 将 化 学 计量 学 与 分 析 化 学 作为 一 门 化 学 量 测 和 化 学 信息 学 科 之 问 的 关系 以 图 
示 方 法 表示 出 来 了 。 
m [—7 P" | r= 
化 学 ive) [xxm 
， 方法 实验 EM sett n | 
kis жн 选择 设计 控制 "omm pes - i | 
—! L " 
| Í Fo 40, | Dod 
. | ИН : 
ete | 采样 数据 库 实验 设 ] | 过 程 优 多 元 以 [изаи [mau] 
的 相关 | BAK 及 其 检 计 及 其 化 理论 ERS | “| 统计 推断 ;| nim 
e | 方法 RER 方法 LIES 元 分 析 | 。 | 专家 系统 第 理论 | 
图 1-1 化 学 基 测 流程 与 化 学 计量 学 方法 的 关系 示意 图 
从 此 图 我 们 可 以 看 出 ， 对 于 化 学 量 测 的 每 一 步 , 化 学 计量 学 都 有 相应 的 理论 和 方法 学 , OF 
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究 如 何 来 使 化 学 量 测 和 数据 解析 过 程 变 得 更 有 效 ， 实 质 上 ， 化 学 计量 学 就 是 一 门 关于 化 学 量 
测 的 理论 基础 和 方法 学 的 化 学 分 支 学 科 5。 分 析 化 学 与 化 学 计量 学 有 着 如 此 密切 的 关系 ,就 
不 难 理解 为 什么 美国 化 学 会 的 分 析 化 学 杂志 一 一 “Analytical Chemistry” SEE Leif wae Е 
为 一 个 分 支 领域 , 从 1980 年 起 就 每 两 年 对 它 的 发 展 进行 -次 总 结 性 综述 了 。 我 国 分 析 化 学 家 
高 鸿 先 生 在 十 几 年 前 就 预言 过 :“ 数 学 在 分 析 化 学 中 的 应 几 日 益 重 要 ,如 果 说 20 世纪 60 年 代 
是 分 析 化 学 与 电子 学 结合 的 时 代 , 70 年 代 是 分 析 化 学 与 电子 计算 机 结合 的 年 代 , 80 年 代 很 可 
能 是 分 析 化 学 与 统计 学 和 和 应 用 数学 紧密 结合 的 时 代 "。 从 这 一 角度 来 看 ,化 学 计量 学 已 经 成 
为 分 析 化 学 学 科 的 必要 数学 基础 ， 我 们 将 化 学 计量 学 中 从 分 析 化 学 的 信息 理论 基础 、 化 学 采 
样 理 论 及 方法 、 化 学 基 测 过 程 的 试验 设计 与 优化 ， 化 学 量 测 数 据 的 多 元 校正 和 多 元 分 辩 的 定 
性 定量 解析 , 一 直到 分 析 过 程 机 理 研究 、 数 值 模拟 和 计算 机 波谱 解析 、 有 用 决策 信息 的 提取 。 
其 中 包括 化 学 模式 识别 、 化 学 构 效 关系 研究 直至 人 工 智能 与 化 学 专家 系统 的 所 有 内 容 汇 成 一 
书 ， 来 作为 分 析 化 学 手册 的 第 十 分 册 ， 其 初衷 也 在 于 此 。 

分 析 化 学 作为 一 门 化 学 量 测 和 化 学 信息 科学 ， 对 其 量 测 过 程 有 效 性 及 效率 的 估计 和 评价 
就 显得 十 分 重要 了 。 分 析 信息 理论 从 信息 理论 的 角度 来 研究 化 学 量 测 过 程 。 如 果 我 们 将 通讯 
处 理 信息 的 过 程 与 化 学 分 析 中 的 化 学 量 测 过 程 来 进行 比较 ， 就 可 容易 发 现 这 两 个 过 程 十 分 相 
似 ERE 1-290), 
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图 1-2 通讯 信息 处 理 过 程 与 化 学 量 测 过 程 的 比较 


进行 化 学 基 测 的 目的 就 在 于 消除 或 减少 被 量 测 的 化 学 系统 在 化 学 成 分 、 结 构 及 其 他 相关 
信息 的 “不 确定 度 ”。 分 析 信息 理论 和 方法 可 提供 相应 的 概念 和 方法 来 定量 表征 化 学 量 测 系统 
的 “不 确定 度 ” 及 化 学 量 测 过 程 中 体系 之 “不 确定 度 ” 的 消除 或 减少 的 定量 度量 〈 或 称 为 化 
学 量 测 过 程 的 信息 量 之 获取 )。 它 不 但 可 以 对 不 同 的 分 析 过 程 ， 如 分 离 、 定 性 监 定 、 定 量 测定 
等 进行 信息 理论 分 析 ， 还 可 对 现代 分 析 化 学 中 各 类 复杂 分 析 仪器 的 提供 信息 之 能 力 进行 合理 
评价 ， 为 分 析 化 学 最 测 提供 了 一 套 选 择 不 同 分 析 过 程 或 不 同 分 析 仪器 的 理论 基础 和 具体 定量 
方法 。 本章 将 系统 地 介绍 这 些 概念 和 方法 。 


第 二 节 ” 炳 一 一 化 学 量 测 的 “不 确定 度 ” 的 定量 度量 


一 、 分 析 试 验 与 不 确定 度 


分 析 工作 的 目的 是 取得 有 关 未 知 试 样 的 化 学 成 分 与 结构 的 相关 信息 。 所 以 ， 在 进行 分 析 
测试 之 前 . 必 存 在 某 种 不 确定 性 或 称 “ 不 确定 度 ”。 设 有 一 份 试 样 , 其 中 可 能 含有 种 离子 中 
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的 某 一 种 .定性 分 析 的 任务 就 是 确定 这 -离子 确切 是 何 神 离子 . 在 分 析 测 试 之 前 , 存在 有 大 种 
可 能 性 , 或 称 分 析 实 验 有 大 个 可 能 的 结局 。 如 将 上 述 情况 用 数学 式 表 示 , 并 设 上 述 和 种 可 能 结 
уа, as, се, as 发 生 这 大 种 可 能 结局 的 概率 为 po pee се, po WE 
а day щ 
A= 
pr ра се A 
在 此 4 тА FIRED SR TS, URGE TEG TOR Fe EDS SCIO LIT 
分 别 记 为 4 MA, НЕГЕ Ёз E LET EE ETT TE 
_ rape trey da A a, йу 
Tasso $O IT asas pk 
AR BH. AAMT A. 它 发 生 的 可能 性 实际 上 只 有 一 种 . 即 只 可 能 发 生 &,, 而 发 生 a,……， 
a 的 概率 都 等于 零 ， 所 以 。 此 事件 的 “不 兢 定 度 ” 实 际 上 不 存在 、 如 果 存 在 这 样 一 种 “不 确 
定 度 ”的 定量 度量 标准 ， 对 于 事件 .4,、 其 值 应 为 零 ; 然而 ,对 十 事件 AL, 它 发 生 的 可 能 性 就 
BRR, MRE as n.n. а, 的 概率 都 相等 ， 故 此 事件 的 “不 确定 讼 ”很 大 ， 如 存在 一 种 
“不 确定 度 ” 的 上 度量 标准 ,那么 对 于 事件 Al, 其 值 应 该 很 大 或 至 少 要 大 于 零 。 以 下 我 们 将 要 讨 
ONS, RERE PAER” НЕИН. 
=. RRERS UR 
IFTE PRR. ШАКА ЛЕ X hn F 
н 
H =— Dplogp a-p 
仙 农 给 出 了 上 述 定义 并 称 五 WA. lg 一 般 表 示 以 e 为 底 , ER ЕТИ QU AP (nat) ; 如 
果 以 10 为 底 ， 其 单位 为 的 特 (Шо: 而 以 2 为 底 时 ， 其 单位 则 为 比特 《bity。 从 式 (1-1) 可 
知 ， 如 对 前 述 的 两 个 实例 ， 用 式 (1-1) 计算 可 得 
НСА) — — log1—0 
HAD =- DU /k logs) 
= 1801/8) =log tz) 
从 上 述 结果 明显 可 知 ， 事 件 А, 的 不 确定 度 大 于 事件 А, 的 不 确定 度 。 
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OD 非 负 性 ， 即 
H (pis pasts рь) 220 
这 是 因为 p.G=1,2,-- 0А) ORE. KA 129 p.250, BU Mg CoD RT RERUIE H, H X blog p? 
FREH. 
(2) ХРАНЕ ЗЕ, RSE, Bp 
H0,0,-.,0)=0 
所 谓 确定 性 事件 ， 即 为 该 事件 只 有 一 种 可 能 结果 ， 如 用 数学 语言 表达 则 为 ， 对 于 发 生 某 一 可 
能 结果 的 概率 为 1， 而 发 牛 其 他 下 能 结果 的 概率 都 为 零 . 前 而 讨论 的 事件 А, 就 是 确定 性 事件 
的 一 个 例子 。 注 意 到 在 此 实际 上 是 引入 了 一 个 人 为 的 很 说， 即 
lim (—plogp) =0 (1-2) 


RP, p 为 一 表示 概率 的 实数 。 
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引入 这 一 假设 是 因为 log (0; 在 数学 上 为 一 无 意义 的 数 。 可 是 .如 从 极限 的 角度 来 看 , 引 
A G-2) 式 在 数学 上 是 完全 合理 的 ， 如 假设 一 1/e 此 时 
—logp=n 
而 
— plogp —n/e'--0 (1-3) 
随 着 n ШК, п/е 将 很 快 接近 于 零 。 实 因此 时 pp 是 -个 比 ( 一 logp) 更 高 阶 的 无 穷 小 . 所 
以 上 式 实际 上 是 用 极限 的 概念 来 避免 对 log(0) 的 百 接 计算 . 有 了 式 1-3) 的 定义 ， 所 以 有 
H(1,0,,0) = —1log(1) — Sologo— — 108(1):=0 
(3) WU TSBORA RM ST, HK, HI 
HG bier РОНС 1/812) = logt) (1-4) 
所 谓 等 概率 结果 的 事件 , 即 该 事件 有 上 种 可 能 结果 ,而 且 , 发 生 这 上 种 结果 的 概率 都 相等 , 即 发 
生 某 一 可 能 结果 的 概率 都 为 (1/#)， 由 此 性 质 可 知 , 等 概率 结果 的 事件 的 不 确定 度 最 大 。 


д. FARSI RE 
今 考察 两 个 随机 试验 ASB, Див 


А: А, Ap се, A, 
B; Bs Bis зе, В. 
SUS PG A FE УН АШ, D 
H.QCAB) == E Xa Во CA B] 0-5) 
AME Ms MR 4 出 现 结果 ALBI. DUIS B ERHET hA 
H, (Bi A) 一 一 Dp(B,|Adlogl eC, [407 
相对 应 也 可 定义 试验 B 出 现 结果 B, 时， 试验 A ERE F AN 
НАВ) 一 一 Dp(A,|Bdloglpc4,|B] 


更 进一步 . 还 可 定义 在 进行 试验 4 的 前 提 下 试验 8 的 条 件 全 
H(B|A) = X8CAOH,CGB|AO 
= Ур(А,)[— Ep8. Apolog рОВ,1А,)] 
= XXRAOPRG,| Adlogl РОВ, | A.J 
或 在 进行 试验 互 的 前 提 下 试验 4 MAE 
H(A|B) =— DV p(B ptA,| Blog! pA, | B] (1-6) 


ЯКОЕ: 
D H(A|B)=H,..(AB)—H,.(B) 
H(B|A) = H,,,(AB) — H,(A) 
此 性 质 可 由 积 事件 ( 即 同时 发 生 的 事件 ) 的 概率 公式 (参阅 第 十 一 章 ) 直 接 导 出 。 
@ H(A|B)S<H,(A) 
HG | AYH,CB) 
此 性 质 的 证 明 可 参阅 文献 [12]. 
@ 如 果 随 机 试验 4 与 互相 所 独立 ,此 时 (41B) 一 上 Cd4)( 参 阅 第 十 一 章 ), 亦 即 分 析 实 验 
B 与 待 解决 的 分 析 课题 GA) 毫 不 相 于， 当然 做 试验 吾 将 得 不 到 试验 4 的 任何 信息 , 也 
无 从 减少 关于 试验 4 的 “不 确定 度 "。 此 时 ， 有 


A, ABI=H, (A) +H, 6B) (1-7) 
五 、 可 疑 度 、 互 信息 与 散 度 


可 疑 度 的 定义 : ARE X P| BI. H (A 有 实际 表述 了 在 进行 了 试验 В 以 后 的 试验 
也 的 “不 确定 度 ”、 所以, H (AJB) 又 称 为 可 疑 度 。 这 样 定义 的 可 疑 度 ,实际 上 可 以 说 是 反 
映 了 分 析 仪 器 或 方法 提供 信息 的 能 旋 与 解决 给 定 分 析 课 题 的 需要 之 闻 的 关 距 的 定 萃 度量 。 

互信 息 的 定义 ; 

КАзВ) = HA) — HA B) = H,GD — H..(BiA) = IBA) (1-8) 
APF (A; BY 称 为 召 关于 AMER. RIGORI A X: SWEAR. Ait, zÇ 
(1-6) 也 可 称 为 信息 守恒 定律 或 信息 平衡 原理 。 

散 度 或 卡尔 贝克 (Kullback) 信息 量 的 定义 : 

WA p. o 两 个 概率 分 布 ， 

验 前 分 布 p: Ру. Рао BOSE = 1 

ERM aii 990,2, =1 
当 分 布 p 被 分 布 9 取代 时 ， 散 度 或 卡尔 贝克 信息 量 定义 为 


Iq ff p) = Xalogiq; p) (1-9) 
类 似 地 可 给 出 连续 变量 的 散 度 或 卡尔 贝克 信息 量 的 定义 : 
Та if py = qc)log (аСт) /por ide (1-10) 


第 三 节 定性 分 析 的 信息 理论 和 方法 
定性 分 析 作为 分 析 工 作 的 重要 组 成 部 分 ， 提 供 的 是 关于 物质 成 分 、 结 构 特征 方面 的 化 学 
信息 ,回答 的 是 “是 什么 ?” 这 一 问题 。 在 这 一 节 我 们 将 就 有 关 定 性 鉴定 方法 的 信息 定 其 评价 
方法 、 色 谱 及 层 析 方法 实验 调 优 的 信息 理论 和 方法 、 质 谱 及 红外 光谱 的 编码 与 检索 的 信息 理 
沦 和 方法 等 方面 来 分 别 加 以 介绍 。 


一 、 不 同 定性 分 析 鉴 定 方法 的 信息 量 估价 


在 定性 分 析 鉴 定 方法 的 信息 量 估价 中 ， 一 般 可 分 为 两 种 不 同 的 方法 ， 一 种 是 针对 一 具体 
定性 实验 而 言 ， 以 实验 前 的 结果 “不 确定 度 ” 与 实验 后 的 结果 “不 确定 度 ”之 差别 来 估价 此 
定性 实验 的 信息 量 ， 亦 即 用 前 节 所 讨论 的 实验 前 与 实验 后 的 粒 之 差 来 估价 实验 的 信息 量 ， 这 
样 的 信息 量 估价 可 包括 以 下 几 种 情况 ， 

(CO 结构 定性 分 析 的 信息 量 

关于 结构 分 析 的 结果 之 信息 量 计 算 十 分 简单 .结构 分 析 过 程 可 用 图 1-3 所 示 的 简单 框图 
表 出 。 


图 1-3 结构 分 析 过 程 单 框 示 意图 
作为 分 析 仪器 或 方法 的 输入 , 可 以 是 个 等 概率 的 可 能 化 学 结构 . 而 分 析 仪器 或 分 析 方 
法 的 输出 ， 可 能 给 出 种 尚 不 能 分 辨 的 结构 。 每 种 结构 的 验 后 概率 一 般 是 不 相等 的 。 结 构 分 


析 提 供 的 信息 量 可 按 下 式 来 进行 计算 。 

I(A//BY HOO НВ) 
在 此 .4 表示 试验 前 可 能 存在 不 同化 学 结构 的 事件 ;B AUR EHI T ¿HR RR RY Br kt i 
可 能 存在 不 同化 学 结构 的 事件 :而 C4/iB) 则 表示 在 进行 了 分 析 仪 器 或 分 析 方 法 的 试验 B 后 
所 获得 的 信息 量 。 很 明显 ,进行 了 分 析 仪 器 或 分 析 方法 的 试验 巨 后 所 获得 的 信息 量 应 为 
A.B 两 事件 的 “不 确定 度 " 即 炳 之 差 “!。 


分 析 前 : 
рб) =1/ Gum l,2," ni) 
H(p) =1п(л„) 

分 析 后 : 


pO) = p, (j=1,2. n) 


Нор) = Dpp) 


КАД BY= НКАУ НСВ) 
= dn) — Meloy, ) 
如 假定 实验 后 各 可 能 结构 均 为 等 概率 ' 则 
КАЈ By =) (1-1) 
注意 到 此 时 ICA/B) 与 卡尔 贝克 《Kullback) 信息 旺 定 义 完 全 一 致 了 。 

(=) 定性 化 学 反应 分 析 的 信息 量 

设 有 -- 纯 深 液 , 它 可 能 是 下 述 离子 之 一 的 试 液 ; Ав, Pht, АІ, Zn, Na К, 5 
用 经 典 定性 分 析 方法 进行 分 离 鉴 定 。 设 加 入 试剂 盐酸 ， 如 何 估算 正太 应 (REE) AER 
иа Ө? 

正 反应 (发生 沉淀 ) 时 ， 因 可 与 盐酸 产生 白色 沉淀 的 在 这 6 种 离子 中 只 可 能 是 Ag 和 
Pb** ， 所 以 ,经 此 反应 后 ,可 能 高 子 的 范围 从 6 种 变 成 了 2 种 ， 根 据 式 (1-11)， 可 得 其 化 学 
反应 过 程 所 得 的 信息 量 为 

ICA// B) - HCA) - HCB) —1n(6/2) —1n3 

无 反应 时 ， ИЖЕР ЖЕ HEIE ЕА GE FP AT М AC Zn, Na КОФ 
任何 一 种 ， 所以, 经 此 肥 应 后 ， 可 能 离子 的 范围 从 6 种 变 成 了 4 种， 根据 式 〈1-11)， 其 化 学 
反应 过 程 所 得 信息 量 为 


ICA ff B) —1n(6/4) =JIn(1. 5) 
(=) 测定 物理 常数 鉴定 有 机 化 合 物 
测定 熔点 、 沸 点 、 折 射 率 ， 密 度 等 物理 性 质 常用 于 有 机 化 合 物 的 鉴定 。 今 试 以 纯 物 
质 的 熔点 测定 为 例 ， 来 考察 某 次 物理 常数 测定 所 获得 的 信息 量 。 设 所 测 物 质 在 分 析 之 前 
就 已 知 应 是 属于 在 温度 100°C 至 200°C 的 一 种 物质 ， 又 已 知 在 此 温度 范围 之 内 可 能 存在 
200 种 有 机 化 合 物 ， 如 进而 设 它们 将 等 概率 分 布 于 此 澳 度 区 同 ， 则 在 量 测 之 前 的 不 确定 
He. BAH 


НА) =1а(200) 
经 量 测 后 知 , 其 熔点 为 (100 士 1)*C, 从 已 知 在 此 温度 范围 之 内 可 能 存在 200 MUEBLES LE 
们 将 等 概率 分 布 子 此 温度 区 则 ， 则 测定 后 的 入 为 
н‹В)у=1а[ (200/100) X 22—1n (4) 
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此 实验 的 信息 量 为 
H(A)-H(B)=In(200/4)=1n(50) 


二 、 仪 器 定性 分 析 的 信息 晤 


如 前 所 述 ， 在 定性 分 析 的 信息 量 估价 中 ， 一 般 可 分 为 两 种 不 同 的 方法 ， 前 ~… 节 已 经 
讨论 了 针对 某 一 具体 定性 实验 信息 量 估价 方法 ， 亦 即 用 实验 前 与 实验 后 的 祖 之 差 来 估价 
实验 的 信息 起 , 在 这 一 千里 ,将 讨论 另 -- 种 专门 针对 仪器 定性 分 析 的 信息 量 估价 方法 .这 
类 方法 之 主要 思路 是 直接 估价 仪器 信号 的 米 ， 亦 即 该 仪器 可 获得 的 信息 量 。 化 学 计量 学 
方法 就 是 通过 采用 化 学 实验 的 方法 努力 增 大 仪器 的 分 析 能 给 出 的 信息 量 或 是 采用 编码 
的 方式 使 得 仪器 分 析 的 结果 能 足 性 多 地 给 出 信息 ,以 达到 用 信息 量 来 作为 月 标 冰 数 , 从 而 提 
高 仪器 定性 分 析 的 效率 。 

(—) 薄 层 及 纸 上 层 析 分 离 与 定性 鉴定 

薄 层 色谱 与 纸 色谱 分 离 一 般 以 R 值 表 述 ,不 同 的 化 学 物质 具有 不 同 的 Ri 信 . 如 将 薄 层 色 
EAR т 个 间距 ， 对 落 人 每 个 间距 的 Rt 值 的 个 数 ww 计数 ， 则 薄 层 及 纸 上 层 析 分 离 与 定性 鉴 
定 的 信息 量 可 由 下 式 给 出 5 


== /ln Ou fn) (1-12) 


此 式 是 较 时 将 信息 理论 引 人 薄 板 层 术 的 马 萨 特 《Masvart)-* 所 用 的 式 子 ， 它 的 物理 意义 
是 很 直观 的 . 如 个 化 合 物 均 落 在 其 个 间距 中 , 则 此 时 了 为 零 , 未 获得 如 何 分 离 与 信息 。7 值 
只 有 在 寻 个 化 合 物 均匀 分 布 在 六 个 间距 时 最 大 。 此 信息 量 可 用 作 寻 找 最 佳 展开 试剂 的 日 标 
Ж. 

CO 色谱 分 离 鉴定 的 信息 量 

在 色谱 分 析 中 ， 一般 是 利用 保留 指数 来 进行 定性 分 析 ， 与 薄 层 色谱 和 纸 色谱 的 不 同 之 处 
是 ， 每 一 个 化 合 物 都 由 一 个 色谱 峰 来 表示 ， 存 在 着 色谱 峰 相 互 重 要 的 问题 ， 所 以 ， 色 谱 分 离 
监 定 的 信息 量 比 起 薄 层 色谱 和 纸 色 潜 的 信息 量 计算 多 了 一 项 ， 仿 薄 层 色 凡 的 处 理 方法 ， 将 保 
留 时 间 进 行 区 间 离 散 化 ， 即 划分 为 等 长 的 (Ay) m Br. 统计 -定数 量 的 仁 合 物 CB Go 的 保 
留 指数 落 人 天 同 段 的 频数 ， 则 有 


Доно + InCAy) — In V 2zeot (1-13) 
式 中 , In (ду) 为 一 个 常数 ， 所 以 ， 对 于 不 同 的 色谱 柱 ， 此 项 没有 差别 ， 一 般 可 采用 将 Ay IR 


为 1 而 去 掉 。 式 中 的 第 三 项 tn V 2rxea3 实 际 是 来 自前 - - 节 所 定义 的 可 疑 度 , 在 此 表述 了 在 进行 
了 色谱 分 离 以 后 的 化 合 物 靠 保留 指数 来 定性 时 的 “不 确定 度 "， 也 就 是 说 是 色谱 峰 的 焙 。 其 中 
а, 为 色谱 峰 的 标准 差 。 注 意 到 在 此 我 们 是 假设 了 每 一 种 物质 的 色谱 峰 的 标准 差 都 是 一 样 的 。 因 
为 由 式 〈1-6) 定义 的 可 疑 度 为 

H(A|B) =— PEPPA, |Blog AABO] 
E, BORTRE k BERE RUMOR. EREA EROR. BH (17а), p CALLBO 为 第 
《种 化 合 物 在 色谱 仪 中 的 信号 ， 一 般 假 设 为 标准 差 为 o 高 斯 色谱 峰 。 对 此 积分 所 得 结果 就 是 


-In Моле, 详细 讨论 可 参见 文献 12]. Н (1-12) 定义 的 信息 量 标准 ， 可 用 于 选择 不 同 
流动 相 或 色谱 柱 。 


(=) 质谱 定性 鉴定 的 信息 原理 

质谱 是 本 世纪 出 现 的 分 析 方法 。 质 谱 仪 的 功能 是 产 牛 带电 离子 ， 包 括 母 离子 和 原 分 子 的 
离子 碎片 , 并 按 离子 的 质 荷 比 O/o 对 化 合 物 进行 区 分 , “质谱 ”是 不 同 离子 数 日 的 记录 , 每 
种 离子 的 相对 数 日 对 每 种 化 合 物 〈 包 括 同 分 异 构 体 ) 将 是 笑 征 的 。 质 普 仪 能 提供 关于 有 机 化 
合 物 结构 和 固态 试 样 元 素 分 析 的 大 量 信息 。 所谓 “化 合 物 的 质 溢 ”， 包含 大 量 的 离子 碎片 ， H 
这 些 碎片 离子 的 相对 丰 度 时 党 超过 母 离子 ,分 子 碎片 化 的 独特 性 有 助 于 化 合 物 的 监 别 工作 . 质 
谱 鉴 定 可 用 不 同 的 方法 进行 。 一 种 是 解析 法 ， 即 研究 与 假设 破碎 异 式 ， 并 反 过 米 从 纯化 合 物 
质谱 中 的 碎片 离子 来 构思 分 子 的 结构 。 另 一 种 办 法 是 检索 ， 即 不 管 质 谱 图 的 含义 ， 从 已 有 的 
数据 库 中 检索 。 本 小 节 主 要 讨论 信息 理论 在 质谱 检索 中 的 应 用 。 

利用 质谱 进行 定性 鉴定 ， 我 们 先 对 其 讯号 能 提供 的 信息 量 作 一 粗 下 估计 。 设 用 一 低 分 辨 
率 质 谱 仪 ， 其 质 荷 比 区 间 仅 200 原子 质量 单位 ， 如 用 信息 论 的 观点 就 是 200 个 信道 。 又 设 每 
一 质量 数位 置 我 们 仅 区 别 有 峰 其 编码 为 D 与 无 峰 《其 编码 为 0), 使 用 这 种 0-1 编码 时 ， 则 
每 个 信道 的 最 大 可 提供 的 信息 量 为 1bit (142， 在 此 ld 表示 以 2 为 底 的 对 数 )， 如 果 做 到 每 个 
信道 都 相互 不 相关 ， 这 一 你 分 闪 率 的 质谱 仪 理论 上 可 提供 200bit 的 信息 量 ， 即 大 约 能 分 辩 
2z 种 不 同化 合 物 ， 这 个 数目 当然 远 远大 子 目 前 已 知 的 有 机 化 合 物 的 个 数 。 

枫 试 从 统计 角度 米 探 讨 一 下 将 谱 图 编码 后 ,互相 重复 的 可 能 性 .没有 个 谱 图 , 按 0-1 编 
Py. БАУ а 个 “信道 "， 即 原子 离子 质量 单位 数 .在 研究 谱 图 与 的 重复 问题 
1 将 每 一 谱 图 认 作 一 个 向 量 : 


3 
可 


x= (zi, er.) 
у= yet»? 
向量 中 的 每 一 元 素 z 或» AAA ORI, ШЖ CAMP LEE ELAR РС. 
y.) ,将 编码 重复 的 情况 及 不 重复 的 情况 可 分 别 表述 为 
Flr.yJ=0 — Mn-» 
F(zay)=1 EELAS 
再 定义 函数 D. URENA RE PRAT ERS T, 
D = Fax) 
可 以 证 明 函 数 厂 的 期 望 值 刀 在 信道 ; (在 质谱 中 即 为 某 -- 质 荷 比 数 ) 1 的 概率 ， 及 信道 
i 出现 0 的 概率 鄞 为 0. 5 时 可 达 最 大 中。 
SER E, 如 从 信息 理论 米 考 不 , 同样 可 以 得 出 上 述 绪论。 对 于 质谱 的 0-1 编码 ， 每 个 信道 
i КИЙИН ЛГА (1-14) H: 


H, == J paldpa = 1 (1-14) 


xb. ра (#=1, D 表示 信道 了 在 N 张 质谱 图 中 出 现 1 (一 1 时) 或 0 G—2 时 ) 的 概率 ， 
显然 , 根据 等 概率 事件 焙 最 大 原理 , RAY 加 一 0.5(k=1,2) 时 ,已 为 最 大 。 当 质谱 的 = 个 信 
道 都 相互 不 相关 时 ， 此 时 对 N 个 质谱 的 0-1 编码 的 总 信息 量 为 


H= Ун, = > 一 Page =n 
= = гет 


但 实际 编码 由 子 各 信道 之 间 存 在 相关 性 ,上 述 所 得 实际 是 0-1 编码 可 以 得 到 的 极 大 值 , 将 其 记 
为 Н, 定义 实际 可 得 信息 量 Н, 与 最 大 可 得 编码 信息 量 Hm 之 比 为 编码 效率 (code efficien- 
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CE), 
CEX= LH) X 100% = (Hurn) x100% 
在 20 世纪 ТО 4E FCR) BI T fri В КОШ НИ И ИЗ КУЖ НЕДЕ то ,研究 了 如 何 
进行 编码 能 提供 最 大 的 信息 ,而 又 尽 串 能 节省 计算 机 内 存 与 缩短 检索 时 间 等 问题 。 
在 0-1 编码 的 问题 中 , 需 确 定 在 何 种 情况 下 应 定义 信道 具有 峰 即 编码 为 1。 为 此 需 确 定 
一 临界 水 平 值 (TL 值 ) ,强度 大 于 (或 等 于 ) 此 值 认 作 有 上 蜂 , 洛 则 认 作 无 峰 ， 显 然 ,TL 值 如 选择 
过 低 , 则 噪声 信号 亦 可 能 被 认 作 分 析 信号 ,在 极端 情况 下 ,每 一 信道 均 出 现 1, 信 息 量 将 降 至 
零 ; 如 了 TL 值 取 得 过 高 , 则 许多 微弱 蝇 度 的 分 析 信 和 号 均 被 认 作 为 零 , 亦 将 损失 信息 量 ,以 基 峰 的 
0.01% 至 0,3% 强 度 作 TL AN BREE. OY TL ALAA 1% 以 上 时 .信息 量 下 
BE. ERRER T-L 值 易 受 噪声 的 影响 ,折衷 的 方案 是 取 LUC TL A, 当然 ,对 不 同 的 质量 数 
取 不 同 的 TL 值 ,或 通过 调整 TL 值 使 相应 质量 数 的 信息 基 H EUR EE E 
TL 值 对 信息 量 有 一 定 影响 ,但 借调 整 TL 值 增 大 信息 量 是 有 限 的 。”* 值 基本 上 是 质谱 峰 
的 自然 分 布 概率 所 决定 的 .有 的 质量 数位 置 出 现 峰 的 概率 很 小 ,有 的 p IE RK RMS 
机 内 存 要 求 及 增 大 编码 效率 的 办 法 之 一 ,是 舍弃 pi 其 别 很 大 的 质量 数位 置 ,这 对 信息 基 影 响 
不 大 ,但 能 减少 对 内 存 的 要 求 。 更 好 的 办 法 是 在 考虑 到 信道 之 间 相 关 性 的 基础 上 ,将 某 些 信道 
合并 ,以 处 基 减 少 信道 而 使 信息 量 减 少 不 多 。 如 已 知 质量 数 为 86 的 p(861) (出现 有 峰 的 概率 ) 
为 0.236, 而 质量 数 为 87 的 pC871) 为 0.246, 如 将 二 信道 合并 ,在 此 两 信道 信号 不 相关 的 条 件 
下 ,可 得 pa 为 0.48。 然而 ,实际 上 并 非 如 此 。 对 数据 库 进 行 分 析 可 知 ,如 在 质量 数 为 86 位 置 
出 现 峰 , 则 有 56% 的 情况 在 质量 数 为 87 处 亦 有 峰 , 即 条 件 概率 p87 |85) = 0. 56, 可 见 两 质 
量 数位 置 ( 此 两 信道 ) 是 相关 的 。 下 就 以 此 例 来 说 明 二 信道 合并 时 信息 量 的 计算 。 注 意 到 两 信 
道 合并 后 ,所 谓 有 峰 ( 编 码 为 1) 的 情况 包括 以 下 三 种 情况 :OD 在 质量 数 为 86 fir E SUE B TE 
质量 数 为 87 Shas ERO) 在 质量 数 为 86 位 置 出 现 峰 ,但 在 质量 数 为 87 处 无 峰 :@@ fe BR 
为 86 位 置 无 峰 , 但 在 质量 数 为 87 处 有 峰 。 所 以 ,出 更 编码 为 上 的 概率 应 为 
Pa =p BE) + p (875,86) -p(87,.86.) 
= p 7085 871) + p(85;) 20871861) + P (86: ) 9 (87, 186.) 
= p(87, [1 ~ 2086, |87.) ]2- 8(86)0 01 — p(87, 186,2 ]H- 0. 246 X 0. 56 
= p(87,2{1—[p (861) p(87; 1861) 1/2087.) 4-0. 236[1— 0. 56 ] 2-0. 246 X 0. 56 
= p(87,)—[p(86,)p(87, | 86,) ]--0. 236[1— 0. 56]--0. 246 X 0. 56 
=0. 246-40. 236—0. 236 X 0. 56 
—0. 35<00. 48 
可 见 , 上 例 合并 二 峰 位 置 得 不 到 出 现 1 的 概率 0.48。 对 质谱 峰 的 研究 表明 ,二 质量 数 相差 1 
(1H)、2C2H)、13(CH)、14(CH2)、15(CH;) 等 数值 时 ,相关 关系 最 为 显著 。 相 关 关 系 本 身 在 编码 
中 可 考虑 作为 压缩 维 数 以 节约 内 存 和 缩短 检索 时 间 的 依据 ,显然 ,将 相关 的 质量 数位 置 合并 损 
失 有 用 信息 较 少 。 
Wangen 等 "对 有 关 文 献 编 辑 的 质谱 图 集中 中 6652 条 低 分 辨 质谱 图 进行 编码 试验 。 这 
些 质谱 系 在 不 同 实验 室 用 不 同 的 电 于 玄 击 离 于 化 仪器 (30 一 100eV) 测 得 ,涉及 约 5000 种 不 同 
的 化 合 物 , 即 不 少 化 合 物 在 此 图 集中 存在 不 同 实验 室 测 得 的 互相 重复 的 压 谱 。 借 此 可 校 验 编码 
的 使 用 效果 。 作者 比较 了 0.1% .1.0% 5.0% — RET L 值 用 于 编码 , 约 5000 种 化 合 物 摄制 的 
6652 条 质谱 经 编码 后 ,相互 重复 的 组 数 见 表 1-1。 由 表 可 多 ,TL 值 由 0.1 7E 1.0% ,相似 异 
构 体 或 相似 化 合 物 给 出 重复 的 质谱 编码 的 情况 并 无 显著 变化 ,1. 0% 是 较 佳 的 TL 值 。 
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表 1-1 Amid 5 E eft 


结构 重复 的 化 合 物 特 征 
АСА 重复 组 数 ОЕК 一 一 — 7 -- 
EN! 回 一 化 合 物 ЖЖ 相似 结构 及 其 他 
0.1 167 370 EIE + f 
° 209 451 А 156 i 38 15 
5.0 376 336 | 335 98 43 


表 1-1 涉及 352 个 质量 位 置 。 按 上 述 合并 质量 数位 置 的 办 法 ,将 原 352 个 质量 数 合并 至 
80 个 ,并 取 TL 值 为 1% ,在 表 1-1 的 基础 上 增加 的 重复 编码 数 见 表 1-2. 如 利用 相关 关系 进 一 
步 合 并 一 些 质量 数位 置 , 使 信道 数 压缩 至 48, 进 一 步 增加 的 重复 编码 质谱 图 数目 亦 列 于 表 1- 
2. 从 表 1-2 可 以 看 出 ,经 压缩 维 数 后 信道 的 编码 效率 CE 值 增高 。 80 信道 的 最 大 炒 值 为 80bit， 
实际 提供 的 信息 量 为 76. 5bit, 故 编 公 效率 为 95. 6%% , 较 使 用 352 维 信道 时 , 虽 绝 对 信息 量 由 
131. 7bit 降 至 76. 5bir ,编码 效率 则 较 原 37.4%% 提 高 其 多 , 即 能 更 有 效 地 利用 有 限 的 计算 机 
内 存 。 


表 1-2 正 缩 编码 维 数 对 检索 的 影响 


# & 48 
ТТИК UU m 7 2 
增加 的 重复 并 prave 1 m m 7 
图 水 及 的 化 合 YUY 7 1 15. 

ETT: 相近 结构 及 其 他 n" 50 
Hit MT mmm 555 
总 信息 最 /bit ww авв 
СЮ 7 95.6 95.4 
与 352 HEUS ke BEIR zp B ЎА с 55.2 85.5 


上 述 讨 论 的 0-1 编码 是 最 简单 的 编码 。 实 际 上 ,在 某 一 质量 数位 置 有 巍 时 , 话 的 强度 还 包 
含有 化 学 信息 。 设 每 一 信道 的 峰 强 度 可 分 成 mm 个 阶梯 或 水 平 ,在 编码 时 应 将 这 部 分 信息 灾 加 
以 考虑 。 令 p Hi 信道 的 峰 落 人 & 水 平 的 概率 , 则 在 各 信道 是 相互 独立 的 情况 下 ,有 


H, = Ун, 


H. 一 一 sp 
(BD. 红外 光谱 定性 鉴定 的 信息 原理 

上 节 讨 论 的 关于 质谱 编码 的 信息 原理 ， 对 各 种 电磁 波谱 分 析 原则 上 均 是 适用 的 。 各 种 电 
磁 波 谱 中 ， 红 外 光谱 是 较 常 用 的 有 机 化 合 物 波谱 鉴定 手段 。 本 节 将 以 红外 光谱 为 例 进行 简要 
讨论 ， 其 他 电磁 波谱 分 析 可 举一反三 类 推 , 如 将 前 节 中 的 质量 数位 置 改 为 红外 光谱 的 波 数 或 
波长 小 区 间 , 可 对 红外 吸收 光谱 进行 编码 , 凡 吸 收 等 于 或 超过 某 一 约定 的 临界 水 平 TL 值 者 均 
编码 为 1， 否则 为 0， 邯 得 0-1 编码 ， 如 再 将 吸收 峰 带 强度 划分 为 若干 水 平 ， 则 还 可 进一步 得 
到 更 多 的 化 学 信息 。 

AERO LR eM ASTM 红外 光谱 索引 (ASTM Infrared Spectral Index) 中 的 红 
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Sh He SOG ЕТ АН, 所 有 文件 包括 了 约 102000 条 红外 光谱 GR Wy-andotte-ASTM 3548 
13071 got 2. 0~ 15. 9km 波长 区 域 划分 为 宽度 为 0. lum 的 140 RRE, 在 每 一 波长 段 , 如 吸收 
强度 超出 选 定 的 TL А, 则 编码 为 1, 杏 则 为 0). 由 ASTM 文件 编码 96900 条 红外 光谱 (WL- 
1)。 如 无 误差 及 相关 关系 的 影响 存在 ，W1-1 文件 的 信息 量 在 选取 100 个 峰 时 约 50bir。 实 际 
由 于 误差 及 相关 关系 的 影响 , 只 能 达到 20bit 左右 。 当 然 , 20bit 信息 量 仍 足 以 区 别 108 个 化 合 
物 ， 故 其 信息 功能 仍 是 很 强 的 。 红 外 光谱 与 质谱 有 不 同 处 ， 因 波长 区 段 或 波 数 区 段 的 划分 与 
质量 数 相 比 ， 有 任意 性 。 为 了 说 明 波长 (或 波 数 ) 区 段 划分 的 宽度 对 信息 量 的 影响 、 取 WI.- 
1 文件 的 一 个 子 集 WLS-1 СА 5100 条 光谱 ) 进行 扩充 谱 带 “ 窗 ” 的 试验 。 按 0. 1xm“ 窗 ” 宽 
度 编码 后 ,对 含有 峰 〈 编 码 为 1) 的 波长 自作 如 下 处 理 : 如 某 一 波长 区 段 含 有 峰 (1), 则 将 
相 邻 的 二 波长 段 亦 赋予“1”， 即 得 “ 窗 ” 宽 为 0. 3km 的 编码 〈 记 为 WLS-1-3)。 进 而 将 WLS- 
1-3 文件 再 按 相 同 办 法 扩 “ 窗 ”可 得 “ 窗 ” 宽 为 0. Sum 文件 CWLS-1-5), 这 一 扩 窗 步骤 示 于 
K 1-3, 对 原 按 0. 10m 波长 区 段 编码 的 文件 进行 上 述 处 理 后 , 对 信息 量 将 发 生 影响 。 这 种 影响 
与 三 个 因素 有 关 : O 扩 “ 徐 ”后 由 于 许多 波长 区 段 的 “1” 增加 ， 即 概率 р, 值 增加 ,信息 量 
—# EE. Ж. p 值 增 至 超过 О. 5 以 后 信息 量 又 下 降 , 这 个 因素 可 称 为 概率 效应 。 字 误差 
效应 。 误 差 将 使 信息 量 降低 。 随 着 “ 窗 ” 扩 大 这 一 影响 的 相对 值 将 减弱 。 鲍 祖 关 效应 。 扩 
“ 窗 ” 肯 定 导 致 相关 关系 的 增加 。 例 如 位 置 有 峰 ，;7 一 1 与 ;十 1 亦 赋值 “1”。 这 导致 信息 量 
降低 , 表 1-4 例 举 将 WLS-1 的 窗 扩 至 0. Зит (WLS-1-3) Ж 0. Sum (WLS-1-5) 信 息 量 较 WLS- 
1 发 生 的 变化 .“ 十 ”代表 信息 量 增 加 .“ ”代表 减少 。 对 WLS-1 本 身 而 言 ， 亦 存在 误差 与 
相关 关系 对 信息 量 的 影响 , 在 表 中 亦 列 出 以 资 比 较 。 总 之 , 将 光谱 编码 的 “ 窗 ” 适 当 扩充 ， 例 
如 由 0. lam 扩 至 0. 3pm， 对 增加 信息 量 是 右 刊 的 ， 


表 1-3 红外 光谱 编码 的 扩 “ 窗 ”步骤 示例 


L 4 位 к 
х f “mH Bum e P = 
BER Fl | os +1 n pP | 1-4 
WLS 0.1 0 9 1 a 1 0 | Q8 
WLS-1-3 0.3 o 1 1 1 1 1 ,0 
WLS-1-5 0.5 | 1 1 1 1 | 1 1 1 
#14 红外 光 谐 编码 信息 量 (o 与 “ 窗 ” 宽 的 关系 
em A Ж WLS-1 | WLS 13 WLS-1-5 
概率 效应 (+ 7 22.6 зз 
误差 效应 〈 一 ) 26.5 12.3 1 6.1 
相关 效应 (一) 6.1 20.7 . 14.0 
总 效应 | ZZ | ET 


对 于 МІ 文件 , 当 取 全 部 140 AERAN, Fy 15И. 择优 选 出 93 信道 的 纺 
码 效率 增 至 23%。 如 无 误差 存在 , 140 信道 的 效率 当 为 41% ,93 信道 当 为 51% 。 可 见 , 误差 
效应 对 信息 量 有 重大 影响 。 扩 “ 窗 ”能 提高 编码 效率 。 例 如 ， 对 优选 的 信道 ， 当 WLS-1 的 编 
码 效 率 为 24 时， 扩 至 多 LS-1-3 541%, WLS-1-5 35 46%. 

在 记录 用 于 编码 检索 的 红外 光谱 时 ， 应 固定 实验 操作 条 件 ， 例 如 先 将 整个 光谱 区 的 基线 
调 至 透射 率 (T) = (95-2090, DOR ERR RUE WIESE T— 542% 《改变 吸收 池 摩 度 )， 
不 时 校正 波长 表 度 ， 对 所 用 化 合 物 进行 严格 提纯 精制 ， 峰 强度 取 最 高 峰 处 的 透射 率 与 基线 的 
XB. 峰 强 度 低 于 一 定 TL 值 时 编码 为 0， 否则 为 1。TL 值 较 高 时 ,出 现 的 “0” 增加, 使 有 
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用 的 可 供 选 用 的 信道 数 下 降 。 文献 [21] RAT 354. 5. 106 ERR TL BAR. ATL 
值 选 出 的 有 用 信道 数 及 信息 量 列 于 表 1 5 和 表 1-6, & 1-5 是 将 波 数 《wave number. WN) 由 
4000cm- Hz 25em ! 为 一 段 均 分 为 140 BE. ( 称 WN-HB), A 1-6 是 将 波长 《wave length, 
WL) 2. Oum 起 按 每 0. jam 波长 段 分 为 140 Bt RWL- REM TL ATX. 在 
将 最 强 带 调整 至 5% 时 ， 若 了 ==1% 的 误差 ， 则 在 近 7 工 值 处 造成 的 误差 当 了 7 也 为 3 多 时 了 一 
0.25%, HTL X 109683 T —0. 194, ERIRE BTL 值 为 3 经 时 ， 由 此 造成 的 信息 量 下 
降 为 0.03bit。 另 一 项 可 能 的 误 盖 是 记录 峰值 的 实验 误 益 , 对 WL B, 在 长 波长 区 这 一 误差 将 
BEF, 故 WN- 码 的 可 靠 性 较 高 。 光谱 区 间 划 分 校 Wi- 码 在 (3500— 2500) cm КЕН 
较 少 , 这 是 由 于 在 这 一 区 域 将 两 个 或 两 个 以 上 的 峰 编码 为 一 个 “1”, 用 WN- 码 则 可 免 此 弊 . 故 
WL- 码 的 信息 量 一 般 很 低 。 对 较 高 波 数 区 . 则 可 能 出 现 相 反 情 况 , 但 考虑 到 相关 关系 等 因素 ， 
总 的 说 来 wN- 码 的 信息 量 较 大 ， 故 选择 WN- 码 一 般 效 果 较 住 。 


表 1-5 TL 值 对 WN- 码 信息 量 (no 的 影响 


TL=3% TL-3% TL=10% 
x Rok - " - uu 广 一 
AEE 信道 数 信息 量 信息 基 信道 数 

CHS-WN 1d E E ~ DE 
CHU-WN 31.5 4T 29.7 42 24.9 35 
CH-WN 38 1 E 18,8 19 25.0 т 
ALC-WN 28.7 | 48 28.7 ч 28.5 45 
ETH-WN 17.8 21 WI 17 22.2 34 
CARB-WN 15.5 28 15.4 26 14.9 25 
A-WN 11.3 73 wo | 65 36.5 61 


@ CHs--—füAké. CHU RAAB: CH 一 一 AEM RE ALC 8, ETH— ME; CARB ЖЖ. 
A—ULS iS. 


表 1-6 TL 值 对 WL- 码 信息 量 (uo 的 影响 


T 


TL=3% Thai TL-10M 
“ER - ay - - 
as 信道 数 信息 量 | Mak 信息 量 信道 数 

CHS-WL — TR? 25 7+6 1877 5-8 18 
CHU-WL 26.3 15 2.5 50 19.9 34 
CH-WL i BR 57 61. 50 16.9 32 
ALC WI, L 248 48 248 48 24.1 48 
ETH-WI, 212 35 20.5 35 a01 | 36 
CARB WL : 一 18.9 2 141 23 
AWL | ato 99 42.6 эз 37.1 88 


Heite 等 5 研究 了 以 相关 系数 作 指 标 将 峰 位 置 按 数值 分 类 法 分 组 ， 并 以 信息 基 作 指标 由 
ЖИЕ Hi ME LC c. “ТЕПЕ”. 由 此 可 得 到 相互 较 独立 的 信息 量 较 大 的 红外 峰 位 置 ,在 此 基础 
土 再 进一步 重新 编码 。 对 5100 个 化 合 物 组 成 的 样本 “ASTM 红外 光谱 索引 )， 在 由 140 TE 
谱 分 段 选 出 40 个 编码 时 ,97. 7% 的 编码 是 不 重复 的 ,Bink 77) ЕЛЕНА ЖЕНИ ЭБ 
谱 的 结构 相关 模式 ， 用 多 元 线性 回归 分 析 法 分 类 ， 用 可 疑 度 作为 分 类 时 的 优化 指标 。Ritter 
等 ”研究 了 互信 息 与 最 大 似 然 分 类 名 分 类 功能 的 关系 。 


第 四 节 定量 分 析 的 信息 理论 和 方法 


关于 定量 分 析 的 信息 理论 基础 ,Eckschlager 等 曾经 进行 过 较 系 统 的 研究 , ТЕ "Collection 
Czechoslov. Chem. Communicationsz” 杂 志 上 发 表 过 系列 论文 , HEATHER Ih, 在 本 节 
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h, ҖАЕ ЗЕ ESE RS, 
一 、 定 量 测定 的 信息 量 -和 


在 进行 定量 测定 之 前 ， 对 被 分 析 试 样 的 成 分 的 浓度 范围 往往 并 非 完全 一 无 所 知 。 一 般 可 
假设 待 测 组 分 = 的 含量 在 [z> ло] KAA, RASA, RARE А 
po=1/ Gy x 
在 关于 试 样 成 分 浓度 范围 确实 一 无 所 知 的 情况 ， 则 z; — 036. 2,— 100%. 上 述 假设 仍 


成 立 。 
在 完成 定量 分 析 之 后 ， 分 析 结果 一 般 服 从 正 态 分 布 ， 即 z~N Go 只)。 此 处 и AREER 
待 测 组 分 含量 的 真 值 , o? 为 总 体 方差 。 则 验 后 分 布 pLz) 是 正 态 概率 密度 函数 。 用 散 度 或 卡尔 
贝克 〈Kullback) 信息 量 的 定义 : 


IP Hf po) = [scotch poe Idx 415) 
为 积分 方便 均 取 自然 对 数 ， 故 其 单位 为 奈 特 (Nat)。 对 式 (1-15) 积分 得 
IG // pO =ln[ бр) (о v2re)] (1-16) 


实际 上 ,在 完成 定量 分 析 之 后 ,分 析 结果 一 般 用 均值 x 表示 , 则 此 时 可 用 学 生 分 布 来 代替 
正太 分 布 , 当 测定 次 数 为 =, 则 分 析 结果 的 置信 区 各 为 
а.х f n) 
在 此 ， 均 分 差 s CH o 的 样本 估计 ) 可 由 下 式 求 得 
s= МЛ DD — z: 
te 为 学 生 分 布 的 临界 值 ，a A ERR, реп 1 为 自由 度 , 近似 地 , 我 们 可 认为 分 析 测 定 后 的 
后 验 分 布 为 
p' (x)=1/[2t0(s/ V n 2] 
由 此 求 得 的 信息 量 为 
IG pa) =n ler) V n Ое) (1-17) 
从 上 式 可 以 看 出 ,由 学 生 分 布 求 出 的 信息 量 是 一 个 测定 次 数 的 函数 ,一 般 说 来 ,测定 次 数 的 增 
加 且 粳 密度 高 (测定 次 数 增加 时 ,s 不 增 大 ) 可 增加 定 是 分 析 的 信 重 。 
如 果 分 析 结果 存在 系统 误差 8, 即 
@ 一 |z 一 4 
在 这 种 情况 下 ,信息 增益 由 下 式 给 出 
Tb p= pH! po 10 РУ 
在 此 ,poz) 为 待 测 分 析 物 的 验 前 分 布 , p(x) 的 意义 同 前 , 是 服从 IN Ga nO BO IEEE BERE E ER 
数 ， 而 po《z) 则 是 服从 N(x 十 8,0) 的 正 态 概率 密度 函数 ,在 这 里 1(p, / RETA р, RE 
所 后 引起 的 信息 量 的 降低 。 经 运算 可 得 
Ipah ро) =1а[ (е, —ху)/(а 2те) )--[08/)/2) (1-18) 
BR o=o 时 , 仍 得 式 (1-10) 计算 的 7(PNzo) 值 。 由 此 可 见 ， 分 析 方法 的 准确 度 影响 定 
量 分 析 的 信息 量 。 


二 、 提 高 分 析 精 密度 与 准确 度 的 信息 量 
前 节 已 述 及 分 析 方法 的 精密 度 与 准确 度 对 信息 量 的 影响 。 我 们 再 进一步 考察 ， 当 用 一 精 
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密度 较 差 的 分 析 方 法 《例如 半 定 量 分 析 方 法 ) 进行 初步 分 析 后 ， 再 用 具有 较 高 精密 度 与 准确 
度 的 方法 进行 分 析 ， 将 获得 的 信息 量 *，。 

设 对 未 知 样本 作 初步 检验 时 ， 例 如 无 机 物 分 析 ， 常 用 的 这 种 半 定 划分 析 方法 是 发 射 光 谱 
分 析 , 初步 分 析 所 用 的 方法 标准 差 为 oo, 得 到 的 分 析 结果 均值 为 ke， 分 析 结果 服从 正 态 分 布 。 
如 再 以 一 精度 较 高 的 分 析 方 法 对 试 样 作 精密 分 析 ， 如 得 到 的 结果 的 均值 为 w, FEX o B 
oxo, BEBE 


PAZ) = fix V 2т8, )exzp | 一 ма _ maT) 


p(x) = fix Ja exp | — Fle 一 mey) 
散 度 或 卡尔 贝克 (Kullback) 信 息 量 为 
1€ p) = | рас роса 
= 1п(о,/в) + (Ce — po)? 0 05/0205) (1-19) 
式 中 ,oi/) 反 映 了 精密 度 提 高 的 程度 ， 兹 记 为 4，4 值 恒 小 于 1， 其 信念 小 。 说 明 分 析 方 法 


Ж ЛЕН; (eo) (ai) 则 表 引 了 提高 畏 密度 后 对 准确 度 的 提高 程度 ， 记 为 B. 
式 《1-19) 可 改写 为 


IG f/ p) САВ CC (1-20) 
A 01-20) 表述 了 与 精密 度 及 准确 度 相 关 的 因子 4 和 B 对 信息 量 的 影响 。 
=. RESTORE 


在 深信 研 究 痕 量 定量 分 析 时 ， 发 现 分 析 组 分 的 浓度 极 低 时 ， 定 量 分 析 数 据 以 对 数 正 态 分 
布 表述 更 为 确切 。 本 节 将 从 这 一 点 出 发 , 探讨 更 确切 地 表述 痕 量 定量 分 析 信息 量 的 方式 [“o。 
对 数 正 态 分 布 的 分 布 函数 为 
Fi) = ple < т} = раё Inz} = Пао) — 44/0) 


[la — ye 
=ош | exp Дасо ЈУ) 


其 相应 概率 密度 函数 为 
fe = Fir) =1/ Gol n(x) —4]/2) 
=1/(ae V 2к)ехр{ — [In — pF /(207)} (1-21) 


在 考察 痕 量 定量 分 析 的 信息 量 计 算 方法 时 ， 对 待 测 组 分 的 含量 可 以 作出 一 大 略 估计 ， 例 
如 估计 其 含量 最 高 值 为 r， 即 zxE (0,riy， 即 验 前 概率 可 表述 为 
co[ Me move H rE (0,z1) 时 
Шы 其 他 
如 用 某 一 检测 下 限 为 z 的 痕 量 分 析 方法 进行 分 析 , 结果 待 测 组 分 含量 在 x 以 下 , 则 验 后 
分 布 为 
一 1/(zo 一 0) 一 1/xo 3⁄4 z€ (0,20) Bt 
Po 他 
册 此 得 出 痕 量 分 析 结果 待 测 组 分 未 测 出 时 的 信息 量 为 
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10 50. абга) (1-22) 

由 此 可 见 ， 这 时 的 信息 量 与 分 析 方法 的 检测 下 限 有 关 。xz, AR ARERR, 
现 考察 痕 量 分 析 测 出 了 待 测 组 分 含量 时 的 信息 量 7 (P po, 。 如 前 述 ， 验 后 概率 分 布 用 
对 数 正 态 分 布 表述 较为 确切 ,但 由 式 (1-21) 表示 出 的 对 数 正 态 分 布 不 能 反映 痕 症 分 析 测 出 竺 
测 组 分 时 的 一 个 事实 , 即 此 时 z 不 能 小 于 或 等 于 re WERKTE, 用 移 位 的 对 数 正 态 分 布 、 

即 令 其 概率 密度 咕 数 为 
人 Jim jexp{— Пака) ир Be} Є од) 
pir) 
其 他 


此 处 pa 是 in(z 一 zo) 的 正 态 分 布 的 均值 和 标准 养 ， 令 
g=ln(ha) 
上 为 称 位 对 数 正 态 分 布 的 不 对 称 系数 。 由 此 计算 信息 量 得 
ICG// po) Ја Со) Ја (о дле) ] 
RULE. Р ро) SIPU ро). ， 详 细 讨 论 可 参阅 文献 12]. 


、 质 量 控制 分 析 的 信息 量 


在 产品 质量 控制 分 析 中 ， 常 需 保 证 其 所 含 某 一 组 分 的 量 保持 在 某 一 范围 之 内 。 设 需 控制 
的 组 分 允许 下 限 为 zu, ERA zo, 通过 长 期 观测 ,可知 x 的 波动 的 标准 差 为 of, 其 与 允许 上 
下 限 的 关系 可 用 下 式 表 述 : 
一 了 一 kr (1-23a) 
xu 一 十 ko Q-23b) 
xd. т 为 待 榨 制 组 分 的 正常 值 ; 的 取 值 决定 了 允许 范围 的 宽度 。 
我 们 可 设想 多 数 产 品 的 规格 将 落 在 允许 范围 GL. л) 这 一 浓度 区 间 ， 设 落 在 这 一 区 间 
的 概率 为 a， 而 其 余 落 在 此 区 间 之 外 的 概率 则 为 (1 一 a}。 故 验 前 概率 分 布 为 
=a/ (20-21) Y z € 《rszu) 时 
eed o Gad 4 rEGL un it 
注意 到 上 式 中 的 常数 取 100, 是 因为 z RUB R n] fe fk O~ 100% 2B) AAPA RD 
布 是 正 态 的 , 即 zc NGOs. B exor, 
在 进行 分 析 后 ,如 产品 合格 
1/7 ра) а (то) Qo vore)] 


如 产品 不 合格 
Ip ро). аа 1100— у 010101 адо V (2ке) 1) 

一 般 取 0. 9000. 99, Ц a>1—a, A Оет) «10036, ШИЯН, ION рь). ВТ 
ПЛ ро), 。… 即 检查 出 不 合格 产品 时 的 信息 量 较 未 检 出 时 大 , 这 是 易于 理解 的 。 因 在 一 般 条 件 
下 ,我 们 总 是 期 待 生产 合格 产品 ,否则 牛 产 无 从 正常 运转 。 当 发 现 了 不 合格 产品 时 . 较 之 证 实 千 
产 在 正常 运转 ,分 析 工 作 的 信息 量 较 大 。 

前 面 的 讨论 中 ,产品 合格 范围 的 宽度 是 (re 一 rm) 二 2hox ,同时 ,如 (x 一 xL) 之 fo 亦 可 满足 
时 , 即 此 时 用 于 质量 控制 分 析 的 分 析 方法 的 标准 差 必须 小 于 173ker ,那么 ,分 析 方法 应 至 少 能 
提供 下 述 信息 量 

141 Ро) а ln [GR V/ n ) (а уте) )=а(о/ов) (6 Vn )/(а V2xe) (1-24) 
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式 中 ,为 产品 质量 控制 分 析 的 平行 测定 次 数 。 
dug ”分析 仪器 的 信息 功能 


在 分 析 化 学 由 于 迅猛 发 展 出 现 “ 理 论 危 机 ”与 动荡 不 安 的 20 世纪 70 年 代 初 ， 
Kaiser? U^ dk — 48 “元素 分 析 的 定量 化 ” 的 著名 论文 中 . 首先 提出 了 分 析 仪 器 与 分 析 方 法 的 供 
信和 能 力 的 概念 。Kaiser 的 概念 在 分 析 信 息 理论 发 展 中 起 了 重要 的 作用 ， 对 于 比较 不 同 分 析 仪 
器 与 分 析 方 法 的 功能 具有 实际 意义 ， 并 可 用 作 分 析 实 验 条 件 优化 的 指标 。 


一 、 分 析 仪 器 与 分 析 方 法 的 供 信 能 力 


分 析 仪 器 或 分 析 方 法 的 供 信和 能 力 Pa 取决 于 可 量 测 的 量 的 数目 ,及 每 一 量 i 可 区 分 的 阶 
BRS: 


Pa = Dold (S,) (1-25) 


所 谓 可 量 测 的 量 ， 可 以 是 某 一 参量 如 频率 、 波 氏 、 质 量 数 、 电 位 等 的 不 同 取 值 。 Pulli 
Bra AU, 这 实际 上 就 是 各 种 信号 均 认 作 等 概率 时 的 信号 六 .对 电厂 波谱 分 析 仪器 , 这 
种 参量 可 以 是 波长 或 频率 ， 例 如 发 射 光 谱 分 析 中 谱 线 的 波长 代表 -- 个 参量 ， 不 同 波长 的 谱 线 
代表 了 可 量 测 的 量 ， 如 每 一 谱 线 的 强度 又 划分 为 10 УВВ, MS, 为 10。 

对 于 给 定 的 参量 *。 例如 频率 , 不 可 能 将 其 划分 为 无 限 个 可 分 别 测量 的 数值 . 限制 这 一 划 
分 的 因素 是 所 谓 分 辩 率 。 对 频率 而 言 ， 分 辩 率 在 理论 上 是 受到 测 不 准 原理 制约 的 ， 对 任意 参 
量 +， 可 定义 分 辩 率 为 


R(r)=r/ór 
AF, ór 是 最 小 的 可 互相 区 分 的 > 值 。 
对 于 由 参量 的 上 限 ro AFRA 的 区 间 Ar， 将 有 Ar/6r 个 不 同 的 可 基 测 的 位 置 ， 邑 
Ar/ër=R(r)(Ar/r) 
因此 可 定义 


Pa 一 Г RAES. rr (1-26) 
ИЯ 


如 在 Ar UIS RO. SOWIE. HD Rr)、S,(r) 恒 等 于 或 它们 的 均值 等 于 及 和 
So E 
Ра RIS lntre/n) 
如 再 将 时 间作 为 独立 变量 考虑 ， 例 如 时 间 分 辩 的 分 析 仪器 ， 设 仪器 的 时 间 分 辩 能 力 为 
RG) HA XB RO. WEISE US 
ра = f° PRRs e o lara (1-27) 
ШАК S 被 认 作 是 + 和 4 二 着 的 函数 。 如 在 积分 区 间 Rtr) ROK 5 fF I 
取 其 均值 表述 , 则 有 
P =R, Rda (Slo Gu/nclnGo/5) (1-28) 
从 武 (1.28) 可 以 看 出 wn AR R(r)、RG) 对 分 析 仅 器 或 分 析 方 法 的 供 信和 能 力 的 影响 ， 
远 超过 增加 每 _ 可 量 测量 划分 的 阶梯 S 的 影响 分辩 能 力 可 按 数量 级 增加 ,达到 例如 10° 这样 
的 数值, 而 当 5 2 增 至 100 时 ,id (5) 仅 由 1 增 至 7 左右 , 信息 理论 给 我 们 提供 了 这 样 的 
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启示 : 为 了 提高 分 析 仪 器 或 分 析 方 法 提供 信息 的 能 力 ， 如 仅 从 提供 的 信息 量 数量 这 一 角度 考 
起 ， 增 加 可 粗略 量 测 的 量 〈 增 加 分 养 率 ， 增 加 第 二 个 量 测 的 参量 ) 效果 过 超过 改善 量 测 的 精 
密度 。 

Ж 1-7 列举 了 常见 分 析 仪 器 及 方法 的 供 信和 能 力 *3。 表 中 的 数值 系 按 所 涉及 方法 的 一 般 实 
验 条 件 估算 ， 分 子 光 谱 的 分 辨 能 力 的 估算 考虑 了 吸收 谱 带 的 带宽 ， 除 注 明 计数 器 读数 外 . 均 
为 模拟 电路 组 成 的 仪器 。 


RIT 分 析 仪 震 与 分 析 方法 的 供 信和 能 力 


分 析 仪器 或 分 析 方法 Га [кж ок mm! з | тай! 
RAT RD FO WE 7 10 8 1507 rz трае 7 
红外 分 子 吸收 光谱 109 орою, 10° гахи 
RA WIP FR EH 1 1u/10* 55t | 102 18x10 
蒙 外 可 见 时 间 分 辨 分 子 荧光 光谱 10/107 EH | uz 1 10° 1.3 10 
原 于 发 射 光谱 ， 小 型 单 色 器 104 5 10° L1x10 
原子 发 射 光谱 ， 大 型 摄 潜 仪 ws | 5 10° Lx 10° 
AES ТЮК 107 1.0002 10 lix qo 
原子 荧光 光谱 ， 直 读 式 ，50 通道 50 10? 3. 5X 102 
原子 发 射 光 潮 ， 时 间 分 辨 ， 小 型 单 色 器 104 5 10 10 10 т.710 
ЖЭНЕ, ЗЕЕ СЕО 1 10 7.0% 10° 
RFR, ED GFR 〈 单 通道 ) 1 一 1% 10х10 
X- 射 线 荧光 光谱 ， 计 数 检测 10: 5 | 1% 2.2108 
火花 源 质谱 | ow 35 | 10 25x 10 
каи EE 10 | 10 16x10" 
XE 0; | 10t Lax yo! 
从 表 1-7 可 以 看 出 , 欲 解决 复杂 的 化 合 物 成 分 与 结构 分 析 的 问题 , 常 需 采用 现代 分 析 仪 器 
手段 。 这 一 选择 ， 是 不 以 分 析 工作 者 的 主观 兴趣 或 偏爱 为 转移 的 ， 而 是 由 现代 分 析 仪器 的 强 
大 供 信 和 能力 所 决定 的 。 由 于 分 析 工 作 的 仪器 化 、 自 动 化 、 计 算 机 化 等 而 导致 的 分 析 化 学 学 科 


的 深刻 变化 ， 其 根源 亦 在 于 现代 生产 与 科研 的 发 展 ， 向 分 析 化 学 提出 的 供给 大 量化 学 信息 的 
日 益 增长 的 要 求 。 


=. 分析 仪 器 的 信道 容量 


本 节 拟 讨论 与 分 析 仪器 设计 密切 关系 的 信道 容量 问题 ,这 一 问题 对 分 析 仪器 之 间 的 联 用 ， 
及 分 析 仪 器 与 计算 机 联机 等 具有 重要 意义 。 

根据 Nyquist 提出 的 采样 定理 , 作为 时 间 的 函数 CCt) 的 分 析 信号 , 二 次 采样 间隔 时 间 Av 
应 为 


Aty—1/(Qw) 

式 中 ，w 为 分 析 信 号 的 频率 。 

对 子 一 个 分 析 仪 器 ， 其 产生 或 处 理 分 析 信息 的 速率 由 其 信息 量 与 采样 速率 决定 。 对 子 离 
散 分 析 信和 号， 如 每 秒 输出 = TES. QU “йж” A RR, BA, bits. 

Н —— n5 plato) 

对 于 连续 分 析 信 号 , 采样 速率 取决 子 输出 信号 的 频 宽 , 若 其 频率 为 mw (He), 根据 前 面 讨 
论 的 Nyquist 采样 定理 。 最 低 必需 的 采样 速率 应 为 2w G0. 否则 将 损失 信息 。 内 此 , R “ЩЫ 
率 ” 为 


H =— zwf” posteo» 


3489000828 S UA IE AER WETEA), MA WER” Oy 
H=2wXld (eV) (1-29) 

一 个 分 析 仪 器 的 输出 ， 可 能 是 另 一 个 分 析 仪 器 的 输入 ， 或 是 计算 机 的 输入 。 因 此 ， 必 须 
考虑 这 些 认 作 信 道 的 分 析 仪 器 或 计算 机 传输 与 接受 信息 的 能 力 、 即 所 亩 信道 容量 ,或 信道 能 
传送 信息 的 最 大 速率 。 在 不 考虑 噪声 项 的 情况 下 , 式 (1-29) 实际 就 是 分 析 信 号 平均 功率 即 方 
XX V 的 正 态 分 布 信号 时 分 析 仪器 的 信道 容量 。 

若 分 析 信号 与 噪声 (用 N A) 均 服 从 正 态 分 布 ， 合 成 的 实际 分 折 信号 亦 必 服从 正 态 分 
布 ， 则 由 式 (1-29) 表示 出 的 分 析 仪 器 的 信道 容量 可 改 为 

HG) —2wXldt V?xeV +N) 
同 理 ， 噪 声 的 信道 容量 可 表示 为 
H(yix) — H ag — Bw Xld( V2reN) 
作为 最 大 分 析 信息 传输 速率 的 分 析 仪器 信道 容量 C 可 表示 为 
C =тах[ HG) —- H(y|z)]=uX1d(1+V/N) 
—wXldQ S/N) (1-30) 
此 处 S/N 为 信 噪 比 。 

本 节 所 讨论 的 问题 的 焦点 ,就 在 于 研究 几 个 分 析 仪器 联 用 或 分 析 仪器 与 计算 机 联机 时 从 
信道 容量 角度 相互 裴 容 的 问题 。 这 一 问题 与 过 滤 一 分 析 试 液 时 ,将 其 倾 至 一 漏斗 中 情况 颇 类 
似 。 设 滤纸 折 友 得 当 或 漏斗 的 水 性 效率 高 ,可 较 快 地 将 溶液 涉 过 ,否则 速度 减 借 ， 若 倾 牙 速 度 
超过 滤纸 和 漏斗 能 接受 与 流 过 的 容量 ,必然 造成 分 析 溶 液 的 洲 失 . 洲 失 分 析 试 液 即 损失 了 化 学 
信息 ,分 析 工 作 失 败 。 在 分 析 仪器 之 间或 与 计算 机 联机 时 ,如 信道 容量 不 相 严 配 , 会 发 生 类 似 的 
损失 分 析 信 息 的 情况 .接受 前 一 个 仪器 送 来 的 分 析 信 息 的 仪器 或 计算 机 ,其 信道 容量 必须 是 不 
小 于 前 一 仪器 的 信道 容量 ,否则 将 损失 分 析 信 息 ,整个 分 析 系统 是 无 法 提供 正确 的 结果 的 。 

兹 以 红外 光谱 仪 为 例 讨论 式 (1-30) 的 应 用 。 

试 比较 红外 光谱 仪 的 两 种 类 型 :色散 型 (棱镜 或 光栅 ) 及 迈克 耳 进 -傅立叶 (Michaelson- 
Fourier) 型 。 一 般 的 工作 范围 取 4000cm-: 至 400cm- ,典型 的 最 小 分 辩 波 数 为 Scm € 
0. lem! ,红外 光谱 仪 的 分 辩 率 与 扫描 观察 时 间 一 般 可 调 ,而 信 噶 比 SNR 则 是 依赖 于 上 述 变 
量 而 变化 的 。 色 散 型 红外 光谱 仪 有 两 个 缺陷 难于 解决 。 一 是 由 单 色 器 分 出 单 色光 依次 测定 吸 
收 ,得 到 一 张 有 一 定 精度 的 谱 图 所 需 时 间 较 长 ,例如 2min。 另 一 缺陷 是 由 于 使 用 达到 所 需 分 状 
率 必须 用 狭 妖 ,因而 进入 单 色 器 的 光 能 不 能 太 低 , 否 则 难于 检测 。 采 用 迈克 耳 逊 干涉 装置 的 傅 
立 叶 变换 红外 光谱 仪 (FT-IR) 可 免 此 弊 。 由 于 色散 型 仪器 中 ,信号 的 强度 正比 于 观测 时 间 ( 整 
个 光谱 观测 时 间 了 与 分 辩 单 元 M 之 比值 TY/M) ,而 噪声 则 正比 观测 时 间 的 平方 根 [LCT/ 
Му), ВИЕ E SNR 正比 于 [CT/M)'*]。 mi FT-IR 光谱 仪 的 信 噪 比 正比 于 TU. HEER 
测 时 间 相 同 的 情况 下 ，FT-IR 光谱 仪 的 信忠 比 为 色散 型 仪器 的 M'“ 倍 ， 这 一 优点 称 费 尔 盖 特 
《Fellgett) 氏 优点 ,获得 这 一 优点 所 付出 的 代价 ,是 对 与 之 联机 的 计算 机 的 信道 容量 显著 增加 。 

MEAR (1-30) 估算 色散 型 红外 光谱 仪 的 信道 容量 ,如 设 在 吸收 率 接近 0% 时 信 品 比 S/ 
N 值 有 (500/1) ZEA, 在 4000-~400cm-! 光 域 ， 最 小 分 辩 单 元 设 为 zem-:， 为 达到 上 还 信 咯 
比 ， 设 所 使 用 的 仪器 需 调 整 至 慢 的 扫描 速度 ， 应 用 采样 定理 要 考虑 每 一 分 辩 单 元 需 被 采样 
2 次 ， 设 由 此 计算 采样 速率 ， 估 算 w 值 约 2. 22 采样 单元 / 秒 ， 则 信道 容量 C. 为 
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C)= 2.22 1401450041) 419.9 
再 看 FT-IR 光谱 仪 的 情况 . FT-IR 是 从 空间 域 采集 数据 .空间 坐标 CO. PALATE 
仪 小 动 镜 的 位 移动 镜 的 运动 可 以 z=wt ЗӘЙ. с GR HS SR ER, 
于 涉 图 上 是 到 间 和 时 间 的 函数 


b= BG bb 
干涉 图 是 许多 频率 的 加 合 。 每 一 频率 与 光谱 波 数 o 之 间 存 在 - 定 关系 : 
T [ senes - КЕДЕП (1.31a) 


ва) = fi Bco- ?njevt ]dt (1-31b) 


每 一 光谱 波 数 o 对 应 一 与 动 镑 速度 " 相关 的 声 频 ， 
Нау обет !)yu(em;s) 

采样 频率 由 最 高 光谱 频率 cc 决定 ， 如 4000cm !， 可 得 inb=2500Hz， 如 此 时 实际 达到 的 

SNR 值 为 6700/1 ， 则 信道 容量 C, 为 
C,—2500x1d (1--6700/1) = 31776 

FT-IR 光谱 仪 对 与 之 联机 的 计算 机 的 信道 容量 或 运算 速度 要 求 显然 要 高 得 多 。 

BREA HRT CMW HAR, 将 式 (1-18) 用 于 色谱 仪 , w 值 -- 般 至 多 是 数 Hz， 
但 SNR 可 超过 10", SEC 可 达到 50bit，s-! 左 右 ， 用 色散 型 红外 光谱 仪 与 之 联 用 ， 信 道 容 量 
可 能 难于 匹配 ， 而 用 FT-IR 光谱 仪 则 完全 可 以 满足 要 求 。 


三 、 分 析 方法 的 信息 效率 


对 分 析 方法 作出 一 个 较 全 面 的 评价 , 需 考虑 其 精密 度 、 选 择 性 、 表 面 或 空间 的 分 辨 能 力 、 
分 煌 速记 和 成 本 等 等 诸多 因素 。 精 密度 涉及 标准 盖 或 相对 标准 差 ， 对 代 器 分 析 而 吉 ， 可 以 信 
品 比 表述 ; 选择 性 可 以 网 时 能 分 析 的 元 素 或 化 合 物 的 数 日 表述 , 亦 可 以 共存 物质 的 影响 表述 ; 
表 而 或 空间 分 辩 能 力 对 现代 材料 分 析 甚 为 重要 ， 因 材料 科学 研究 的 新 进展 表明 ， 许 多 材料 的 
特异 性 能 不 但 取决 于 某 些 成 分 的 总 含量 ,而且 与 这 些 成 分 在 材料 中 的 空间 分 布 有 关 ， 分 析 速 
度 以 及 分 析 成 本 等 因素 对 解决 实际 分 析 课 题 很 重要 。 除 上面 提 到 的 各 项 指标 外 ， 一 个 根本 性 
的 指标 是 提供 分 析 信 息 的 功能 ， 亦 是 本 节 讨论 的 中 心 课题 ,这 里 将 引入 一 些 补充 概念 。 

有 关 作 者 [5 建议 定义 信息 效率 巨 为 


z- Il. (1-32) 
此 处 e 为 效率 系数 : 

& A exl 

„= 

(0 Mel 
AP, s 是 效率 比 。 对 于 分 析 方法 的 某 一 特性 参数 ,效率 比 是 指 为 解决 某 一 分 析 问题 (p) 所 
需 的 值 与 该 分 析 方法 СА) 所 具有 的 数值 之 比 。 例如， 如 考虑 的 是 信息 量 (7)， 为 解决 分 析 问 
题 p 需 信息 量 1,， 分 析 方 法 А 能 提供 的 信息 量 为 14。， 则 。 值 为 

1/1 (1-33) 

不 同情 况 下 信息 其 的 计算 已 在 前 面 作 过 系统 讨论 。 又 如 指标 是 指 能 测定 的 组 分 数 ， 对 给 
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定 的 分 析 问 题 需 测定 N, 个 组 分 ， 分 析 方法 实际 能 测定 N , 个 组 分 ， 则 


SENIN, (1-34) 
如 指标 是 指 分 析 时 间 ， 设 分 析 工 作 需 在 时 间 Т, 内 完成 ， 而 该 分 析 方 法 需 时 了 ,。、 则 
总 一 (1-35) 


ТАТЕ ERS е1, W Е=1. ШЖ АМАТ. ДЕСІ: 只 要 有 一 个 指标 达 不 到 
要 求 ，“ >1, 即 E 一 0, 该 分 析 方 法 不 能 采用 。 

从 另 一 方面 ,还 可 定义 一 与 分 析 成 本 、 信 息 量 及 信息 效率 由 关 的 指标 , 权 称 信息 效益 : 

R=M(E/r) (1-36) 

式 中 ,z 为 分 析 成 本 ，M = TL ,为 分 析 所 有 组 分 :的 信息 量 之 和 。 

按 上 述 方法 评估 分 析 方 法 提供 信息 的 效益 ,对 给 定 分 析 方 法 而 言 ,其 值 与 分 析 问 题 的 性 质 
有 关 。 对 于 解决 某 一 问题 信息 效益 高 的 力 法 ,在 解决 另 一 深 题 时 不 一 定 有 好 的 效益 。 

Ж 1-8 列举 为 解决 测定 锁 中 锰 含 量 (0. 05 区 一 6 多 Mn) 的 方法 比较 ,分 析 课 题 对 于 测定 标 
准 差 的 要 求 为 10% ,分 析 时 间 的 要 求 则 设 定 一 种 情况 :Ca? 短 于 ldi (ORF 30min; Co) 1 
2min。 由 表 1-8 可 见 , 对 分 析 时 间 要 求 不 高 时 ,例如 可 允许 在 一 天 内 宾 成 分 析 工作 (a) .容量 分 
析 , 电 位 滴定 与 光度 分 析 较 光谱 分 析 的 信息 效率 与 效益 为 高 。 这 一 点 说 明 , 现 代 分 析 化 学 的 迅 
猛 发 展 及 随 之 而 来 的 革命 性 变革 ,并 不 意味 着 分 析 上 作者 将 抛弃 原 有 的 传统 分 析 方法 .这 一 显 
而 易 见 的 事实 , 颇 类 似 于 人 类 进入 了 航天 飞行 的 时 代 , 并 不 意味 着 应 废止 常规 交通 工具 ,或 认 
为 囊 失 步行 能 力 对 人 类 活动 无 关 紧要 。 另 一 方面 , 表 1-8 亦 显示 ,对 要 求 快速 完成 的 分 析 工 作 ， 
在 传统 分 析 方法 已 不 奏效 时 ,仪器 分 析 方 法 确 有 其 优越 处 。 


Ris 钢 中 鳃 含量 的 测定 方法 比较 


相对 та} 分 析 相对 总 信 信息 信息 效益 
分 折 方 法 标准 — gae 时 间 RA . BB 效率 (P) bit: 
ж/м Na Таап | 《货币 单位 ) | CD bit E 单位 成 本 
тастам, 2 1 $ T m г +00 (а) 0.018 0. 0044 
210%) ` (bo 0 
| (o 0 
ИТҮ 2 1 30 : B 4.00 (a) 0.088 0.0044 
' (b) 0.42 0.21 
(20 у 
EATE С 3 1 Í 30 8 3.41 (a) 0. 010 0. 0044 
L EM ' (b) 0.49 0.21 
(0 0 
原子 吸收 法 1 1 20 6 5.00 (a) 0.047 0. 0089. 
(b) 0.22 0.19 
(e) 0 D 
发 射 光 谱 分 析 5 50 3 i 133,8 (а) 0. 00026 0. 0035 
i (b) 0.0013 0.17 
(e) 0 a 
RRC MRE 10 30 30 1 83.8 (a) 0.042 0.007. 
Li (b) 0. 020 0.14 
[Sn E] 
发 射 光 谱 - 光 量子 计 直 5 50 1 20 133.8 (a) 0, 0000087 | 0. 000058 
& (b) 0.00042 | 0.0028 
(c) 0. 0063 0.042 
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第 二 章 ”化 学 计量 学 中 常用 的 名 词 与 术语 


第 一 节 “分析 信息 与 分 析 采 样 


一 、 分 析 信 息 理论 与 方法 


ASTM 红外 光谱 索引 (ASTM infrared spectral index) 对 红外 光谱 数据 库 进行 编码 ,所 
有 文件 包括 了 约 102000 条 红外 光谱 . HE Wy-andottc- ASTM 法 编码 .将 (2. 0 一 15. um 波长 
区 域 划分 为 宽度 为 0. lum 的 140 波长 段 .在 每 波长 段 . 如 吸收 蝶 度 超出 选 定 的 规定 临界 值 ， 
则 编码 为 1， 否则 为 G0。 由 ASTM 文件 编码 了 96900 条 红外 光谱 (WL-1)。 

编码 (coding) 编码 是 通讯 理论 中 常用 的 一 种 方法 . 在 化 学 计量 学 中 常 借用 来 对 波谱 进 
行 编码 。 如 在 质谱 中 , 设 每 一 质量 数位 置 仅 区 别 有 峰 (其 编码 为 1) IEE (其 编码 为 0), 这 
种 编码 方式 常 称 为 0-1 编码 此 时 ， 每 个 信道 的 最 大 可 提供 的 信息 景 为 一 个 比特 (142. 在 此 
ld 表示 以 2 为 底 的 对 数 ) 

编码 信息 量 (coding information) 从 信息 理论 来 考虑 、 不 同 的 编码 方式 所 含 信息 莉 不 
局。 对 于 质谱 的 0-1 编码 , 每 个 信道 ; 的 信息 量 即 炳 值 . N 张 质谱 图 中 出 现 1 或 0 的 概率 均 为 
0.5 时 ， 该 信道 的 信息 量 为 1 比特 。 当 质谱 的 ”个 信道 都 相互 不 相关 时 ， 此 时 对 六 个 质谱 的 
0-1 编码 的 总 信息 量 为 ”比特 。 

编码 效率 (coding efficiency. CE) 通过 编码 实际 可 得 信息 基 与 最 大 可 得 编码 信息 旦 之 
比 称 为 编码 效率 。 当 被 编码 的 每 个 信道 都 相互 不 相关 时 ， 编 码 的 总 信息 量 为 最 大 可 得 编码 信 
息 量 。 但 实际 编码 由 于 各 信道 之 间 存 在 相关 性 ， 实 际 各 得 信息 量 将 恒 小 于 最 大 上 可 得 编码 信 息 
量 。 研 究 如 何 进行 编码 能 提供 最 大 的 信息 量 是 编码 理论 的 一 个 重要 内 容 。 

比特 bit) 对 于 一 个 只 有 两 种 结果 出 现 的 随机 事件 , 如 果 它 们 出 现 的 概率 均 为 0. 5, Ж 
么 ， 该 事件 的 信息 量 就 是 一 个 比特 (logs2)。 

不 确定 度 Quncerteinty) 不 确定 度 是 随机 事件 的 特性 , 信息 理论 中 糖 的 概念 就 是 一 种 随 
机 事件 不 确定 度 的 度量 。 

部 分 因子 设计 (fractional factorial design) 针对 2 水 平 全 因子 设计 提出 了 部 分 因 于 设 
HAR, 一 般 都 具有 2 “的 形式 ， 其 中 2 表示 因子 的 水 平 数 , л 为 因子 数 (或 称 因素 的 数 日 )， 
d 为 可 能 缩小 试验 次 数 的 2 的 乘 方 数 , Ма 为 1 时 , 因 试 验 次 数 可 以 缩小 一 半 , RAE APE 
计 法 之 称 ; 所 谓 半 因 子 设计 ,实际 上 就 是 2 次 因子 设计。 

分 析 信 息 理论 (analytical information theory) ”分析 化 学 是 一 门 化 学 信息 科学 。 在 化 学 的 各 
个 分 支 学 科 中 ， 分 析 化 学 担负 的 任务 与 其 他 分 支 学 科 的 不 同 之 处 ， 就 在 于 分 析 化 学 的 研究 对 象 ， 不 是 
直接 提供 某 种 具体 的 例如 无 机 和 有 机 材料 ， 而 是 提供 与 这 些 材料 的 化 学 成 分 和 结构 相关 的 信息 , BF 
究 获取 这 些 信息 的 最 优 方法 与 策略 。 分 析 信息 理论 是 一 种 从 信息 理论 出 发 ， 用 信息 理论 来 看 
待 分 析 过 程 所 获 信息 量 大 小 和 用 信息 理论 来 评价 分 析 仪器 所 供 信息 量 多 赛 的 一 种 方法 。 

供 信 能 力 (informing power) 分 析 仪器 或 分 析 方法 的 供 信和 能力 Pi 实际 上 就 是 分 析 仪器 或 
分 析 方 法 所 能 提供 的 信号 粹 。 它 取决 于 可 量 测 的 量 的 数目 4， 及 每 一 县 i 可 区 分 的 阶梯 数 S.. 


Pa = УЗ 
= 


ЖИЙ MAE. ARS MAR, КК, ШШ, B FERRE. 已 w 的 
SEAN BR Ой BA Air XX SE Бк Ei Je Sl БИРИ {ЕЖЕНИН (EHE 对 电磁 波谱 分 析 仪器 、 
这 种 参量 可 以 是 波长 或 频率 ， 例 如 发 射 光 谱 分 析 中 谱 线 的 波长 代表 -个 参量 、 不同 波长 的 谱 
线 代 表 了 可 量 测 的 量 ， 如 每 一 谱 线 的 强度 又 划分 为 10 个 阶梯 ， 则 5, 为 10。 

互信 息 (mutual information) 互信 息 是 信息 论 中 个 很 重要 的 正念 ， 它 的 定义 式 为 

T(A;B)=H1(A)—H¢A|B)=H(B)- ACB А)=10Е;А) 
AP. ADRA B ХР AWE B RIBAK AKT B НЕВА. RHH dag. 
同时 ， 上 式 也 可 称 为 信息 守恒 定律 或 信息 平衡 原理 。 

可 疑 度 (equivocation) ”可疑 度 是 分 析 信 息 理 论 中 的 一 个 概念 ， 其 定义 为 ， 在 B 试验 发 
生 后 A + Ий. RI НСА |В), Esc 了 在 进行 了 试验 以 后 的 试验 4 的 “不 确定 度 ”， 
理 (A41B) 就 称 为 可 疑 度 ,这 样 定义 的 可 疑 度 , 实 际 上 可 以 说 是 反映 了 分 析 仪 器 或 方法 提供 信息 
的 能 力 与 解决 给 定 分 析 课 题 的 需要 之 间 的 差距 的 定 其 度 基 。 

Ж (entropy) 入 是 信息 论 和 热力 学 中 一 个 十 分 重要 的 概念 ， 它 是 事物 不 确定 度 和 混乱 
度 的 一 种 度量 ， 其 数学 定义 如 下 ， 


А 
н = - Dplogp, 
= 


在 信息 理论 中 , 仙 农 给 出 了 上 述 定 义 并 称 已 W. log MRA e 为 底 , HOR BT READ 
单位 为 奈 特 (nat); 如 果 以 10 为 底 ， 其 单位 为 的 特 (dit); 而 以 2 为 底 时 ， 其 单位 则 为 比特 
(bit)。 对 于 确定 性 事件 ， 其 炳 为 零 ， 对 于 等 概率 结果 的 事件 ， 其 炳 最 大。 

散 度 (divergence) 散 度 由 Kullback 提出 ， 故 又 称 为 卡尔 幢 克 Kullback) FAE. Ч 
一 个 分 布 Go 被 另 一 个 分 布 (g9， 取 代 时 ,其 定 文 为 

Tq // p) = Malogtg,./ p) 
其 中 Р 为 概率 验 前 分 布 、q 为 验 后 概率 分 布 。 对 于 连续 变量 的 散 度 或 卡尔 贝克 (Kullback) 信 
息 量 的 定义 为 


r 
Ia ff p) = |qGa)log(q (r) pir) de 


ЖЕЙ (conditional entropy) ЖОЗЕ е а И: 其 定义 为 : 如 果 试 
验 4 出 现 结果 A, 时 ,试验 B t: AE ТАН RE RE. 更 进一步 , 还 可 定义 在 进 
行 试验 A 的 前 提 下 试验 瑟 发 生 条 件 下 的 条 忻 炉 ,如 果 随 机 试验 A 与 8 相互 独立 , 则 它们 同时 
发 生 的 丧 等 于 它们 条 件 丧 之 和 。 

分 析 仪 器 的 信道 容量 (information channel capacity of an analytical instrument) 一 个 
分 析 仪器 的 输出 ， 可 能 是 另 一 个 分 析 仪 器 的 输入 或 是 计算 机 的 输入 。 因此， 我 们 必须 考虑 
这 些 认 作 信道 的 分 析 仪器 或 计算 机 传输 与 接受 信息 的 能 力 ， 即 所 谓 信道 容量 或 信道 能 传送 信 
息 的 最 大 速率 。 在 不 考虑 咖 声 项 的 情况 下 ,实际 就 是 分 析 信 号 平均 功率 即 方差 为 V 的 正 态 分 
布 信和 号 的 分 析 仪 器 的 信道 容量 。 

信息 效率 (information profitability) ”Danzer 和 Eckschlager ME X fei ARE E 为 


E= Tle 


此 处 。 为 效率 系数 ， 


€ Mes 
-lo el 
在 此 ，s 是 效率 比 。 对 于 分 析 方法 的 某 一 特性 参数 ， 效 率 比 是 指 为 解决 某 - 分 析 问 题 (р) 所 
需 的 值 与 该 分 析 方 法 (A) 所 具有 的 数值 之 比 。 例 如 , WR CD. 为 解决 分 析 问 
Bip 需 信息 基 1;， 分 析 方 法 А 能 提供 的 信息 量 为 I、， 则 s 值 为 
e= lpia 


二 、 分 析 采 样 理论 与 方法 


采样 理论 (sampling theory) 采样 理论 是 指 如 倍 进 行 试 样 采集 的 数学 统计 理论 .怎样 通 
过 局 部 采样 可 在 统计 意义 上 尽 可 能 的 代表 总 体 ， 是 采样 理论 和 方法 所 研究 的 内 容 ， 分 析 化 学 
中 常用 的 采样 方法 包括 回 体 物质 的 采样 方法 ， 动 态 过 程 的 采样 方法 和 质量 检验 的 采样 方法 。 

采样 常数 (sampling constants) 为 表征 实验 室 样本 的 均匀 人 性， 或 考虑 样本 的 分 隔 效 应 ， 
Jngamell 和 Visman 分 别 定义 了 几 个 采样 常数 ,如 均匀 度 常数 和 反映 分 隔 (segregation) 程度 
的 常数 ， 以 更 好 地 描述 采样 特征 。 

代表 性 采样 (representative sampling) ”代表 性 采样 一 般 指 特定 的 分 析 项 目 所 涉及 的 采 
样 。 例 如 按 环 境 保护 部 门 规定 采集 上 废水 试 样 就 是 这 种 例子 。 在 分 析 化 学 的 实际 工作 中 ， 代 表 
性 采样 是 一 种 分 层 采样 的 特殊 情况 ， 这 种 情况 的 分 层 采样 可 对 目 标 成 分 提供 总 体 均 值 的 无 偏 
fait. 

分 层 采样 (stratified sampling) 当 分 析 对 象 可 划分 为 若干 采样 单元 时 ， 随 机 采样 可 以 
是 总 体 的 全 体 采 样 ， 亦 可 以 是 分 层 或 分 步 采样 。 分 层 采 样 是 先 将 分 析 对 象 划分 成 不 同 的 部 分 
或 层 ， 然 后 对 不 同 的 层次 进行 随机 采样 。 

计量 抽样 检验 (sampling inspection by variable) 计量 抽样 检验 是 一 种 质量 检验 的 方 
法 。 这 种 检验 方法 一 般 是 针对 定量 测试 产品 中 某 一 变量 的 分 布 来 进行 的 。 

计量 抽检 特性 曲线 (operating characteristic curve in sampling inspection by variable) 
分 析 检验 中 常见 的 情况 是 测定 某 一 组 分 的 百 分 含 量 ， 例 如 某 种 有 效 成 分 的 最 低 含量 ， 某 种 有 
害 成 分 的 最 高 含量 等 。 在 考虑 这 种 检验 的 采样 时 ， 首 先 需 确定 合格 产品 的 相应 定量 标准 - > 
很 设 待 测 的 组 分 含量 这 一 变量 服从 正 态 分 布 ， 并 设 产品 中 的 有 效 成 分 工 的 最 低 含量 标准 为 
zy， 分 析 方 法 的 标准 差 为 a， 可 计算 对 应 于 任意 真实 含量 的 < 的 w 值 ， 即 标准 正 态 分 布什 : 

u=(x,7a)/0 

从 标准 正 态 分 布 可 计算 实际 合 量 为 z 时 该 批 试 样 被 接受 的 概率 p。 将 概率 请 对 了 作 图 ,可 得 
计量 抽检 特性 曲线 ， 简 称 OC 曲线 。 

计数 抽样 检验 (sampling inspection by attributes) ”计数 抽样 检验 也 是 一 种 质量 检验 的 
方法， 多 用 于 以 件 计数 的 产品 检验 ， 如 采用 化 学 分 析 方法 ， 则 是 作 定性 分 析 提 供 检验 对 象 是 
否 合格 的 属性 。 例如 用 看 谱 镑 确定 某 种 杂质 存在 或 不 存在 。 对 于 一 批 共 N 个 试 样 ,如 其 中 不 合 
格 的 占 PY SE qa%, 取 个 试 样 找到 < 个 不 合格 试 样 的 概率 P. 可 按 超 几 何 分 布 计算 。 

颗粒 性 质 因子 (particle property factor) Gy 对 非 均 勾 体 系 的 采样 发 展 了 一 套 较 全 面 的 
理论 。 根据 Gy 的 采样 理论 , 图 体 采样 的 方差 公式 引入 了 颗粒 形态 因子 (让 。 如 果 是 在 理想 的 
情况 下 , 颗粒 形态 因子 STAR.: 如 果 所 有 颗粒 都 是 以 为 直径 的 小 圆 球 组 成 时 , 则 颗粒 形 
AAT 了 可 取 0.524。 如 果 总 体 物质 是 具有 特殊 形态 的 颗粒 , 如 黄金 颗粒 , 颗粒 形态 因子 /可 
以 低 至 0. 2. 
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系统 采样 (systematic sampling) 系统 采样 系 指 为 了 检验 某 些 系统 假设 而 采集 的 试 样 ， 
例如 生产 或 其 他 过 程 中 成 分 随时 间 、 温 度 的 变化 而 在 空间 中 变化 ， 这 和 场合 下 的 采样 问题 有 
重要 的 实际 意义 。 一般 是 间隔 一 定 区 间 (时 间 、 空 间 、 区 域 采样 间隔 不 一 定 是 等 距 的 ， 有 
时 事先 可 项 期 总 体 成 分 是 不 均匀 的 ， 系 统 采 样 要 尽 基 减 少 这 种 不 均匀 性 的 影响 ， 对 于 这 样 的 
HAL. TRAD RR. 。 系 统 采 样 的 误 益 分 析 与 随机 采样 是 相似 的 。 

最 小 采样 数目 〈minimum number of samples) ft REG. Ig EI X RS 
下 的 最 小 采样 景 称 为 最 小 采样 数目 ，-- 般 以 质 最 来 计 .。 

第 二 节 ”化 学 试验 设计 与 优化 

半 因 子 设计 法 《half-fraction factorial design) ”针对 2 水 平 全 关子 设计 提出 了 部 分 因子 
设计 思路 、 一 般 都 具有 2"“ 的 形式 ， 其 中 2 表示 因子 的 水 平 数 ， 为 因子 数 (或 称 因素 的 数 
H), d 为 可 能 缩小 试验 次 数 的 2 RER Kd 为 1 时 ， 因 试验 次 数 可 以 缩小 一 半 ， 故 有 半 
因子 设计 法 之 称 ; 所 谓 半 因子 没 计 ， 实际 上 就 是 2”! 次 因子 设计 。 

Exiit (saturated designs) 在 实验 设计 中 , 实验 次 数 (实验 点 数 ) 等 于 所 要 确定 的 未 
知 参 数 的 个 数 的 实验 设计 ， 称 为 饱和 设计 。 

HA PP- 最 优 设计 (saturated D-optimal design) ”在 D- 最 优 设计 方法 中 ， 如 能 使 得 做 到 
实验 次 数 (实验 点 数 ) 等 于 所 要 确定 的 未 知 参数 的 个 数 的 D- 最 优 设计 , 称 为 饱和 Р-НЕ. 

变 尺度 法 (variant scale method) ” 变 尺 度 法 可 看 成 是 局 部 最 优 方法 中 和 梯度 法 和 牛顿 法 
的 一 种 折 广 ,梯度 法 收敛 太 慢 ; 和 牛顿 法 要 计算 二 阶 导数 矩阵 和 矩阵 求 逆 ， 工 作 量 大 。 变 尺 虚 
法 的 基本 思 路 就 是 利用 选 代 和 逐步 逼近 二 阶 导数 和 矩阵 的 着 矩阵 。 因 这 类 为 法 的 搜索 方向 是 不 断 
变化 的 , 故 有 变 尺 度 法 之 称 。 变 尺度 法 有 多 种 ,日 前 用 得 较 多 的 是 DFP 法 (由 Davidon-Fletch- 
er-Powell 提出 ) 和 BFGS 法 (由 Broyden-Fletcher-Goldiarb-Shanno H). 

残 差 正 态 图 (residual normal plot) 因为 正 态 分 布 为 一 般 表示 由 多 种 不 定 因素 击 产 生 
出 来 一 种 分 布 ,是 随机 噪声 的 特征 ,所 以 ,回归 所 得 残 差 应 服从 正 态 分 布 , 残 差 正 态 分 布 图 就 是 
一 种 很 好 的 检验 方法 ,如 所 得 残 差 可 用 正 态 分 布 图 中 的 一 条 直线 表 出 , 则 说 明 模 型 是 合理 的 。 

PAF (generator) 在 因子 试验 设计 中 ， 一 个 构成 半 央 子 设计 的 简便 方法 就 是 先 设 定 
一 个 同名 和 别名 效应 ， 然 后 就 用 这 个 别名 效应 来 产生 别 的 各 个 别名 效应 ， 以 构成 一 个 半 因子 
设计 ,这样 设 定 的 别名 效应 就 可 称 之 为 产生 子 。 

D- 最 优 设计 (D-optimal design) 记 - 最 优 设计 由 统计 学 家 Kiefer 提出 , 是 一 种 基于 使 斌 
验 设计 的 信息 矩阵 的 行列 式 值 达 到 最 大 ， 从 而 使 试验 设计 的 所 得 模型 的 参数 估计 很 准确 的 一 
种 试验 设计 的 方法 。 它 对 于 所 研究 体系 的 模型 已 知 的 情况 最 为 适合 。 

单纯 形 优化 (simplex optimization) 在; 维 空间 R' 中 ， 单 纯 形 是 指 具有 s+1 个 顶点 的 
多 面体 ， 若 各 个 楼 长 彼此 相等 ， 则 称 为 正规 单纯 形 。 单 纯 形 优化 法 是 以 单纯 形 顶 点 为 其 起 始 
研究 对 象 , 通过 比较 , 淘 沐 其 中 最 差 的 点 , 继 利用 反射 ,构成 新 的 单纯 形 , 继续 优化 搜索 ， 以 
达到 寻 优 目的 。 单 纯 形 优化 方法 是 一 种 局 部 最 优 方法 。 化 学 家 们 对 原始 的 简单 单纯 形 法 进行 
了 许多 改进 ， 在 化 学 研究 中 应 用 较 广 。 

单纯 形 试验 设计 法 (simplex experimental design) 单纯 形 试验 设计 法 是 一 种 序 贯 试验 
设计 方法 。 它 以 单纯 形 优化 方法 为 基础 进行 试验 设计 或 寻 优 ， 是 化 学 计量 学 中 试验 优化 方法 
之 一 ， 它 通过 构建 单纯 形 来 安排 试验 ,通过 比较 这 些 试验 结果 ， 淘汰 其 中 指标 值 最 差 的 试验 
点 ,在 可 能 改进 试验 指标 的 方向 新 增 一 个 试验 点 再 作 一 次 试验 ， 继 续 进行 单纯 形 搜索 。 此 
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种 设计 方法 具有 关 活 和 容易 实现 .又 可 序 贯 实行 的 优点 ， 在 化 学 研究 中 应 用 很 广 。 

单纯 形 格子 点 (simplex lattice point) ths 维 试验 空间 中 ，* 因子 的 混 料 区 域 Oum 
G— DEAE SUR. UE LEN A. MURO тете 个 坐标 为 1， 其余 (5 一 1) T 
标 为 1， 则 这 样 的 点 称 为 单纯 形 项 点 。 当 * 一 3 "n 其 单纯 形 是 一 个 高 为 1 的 等 边 三 角形 、 它 
的 三 个 顶点 的 全 体 称 为 一 阶 格子 点 集 , 记 为 {3，1}。 如 将 等 边 二 角形 的 三 边 各 二 等 分 ， 则 此 
三 角形 的 :个 顶点 与 三 条 边 的 中 点 的 全 体 称 为 一 阶 格子 点 集 , 记 为 {3, 2), 其 中 共有 6 个 点 。 
如 将 等 边 三 角形 各 边 d 等 分 , 类似 地 可 得 台阶 格子 点 集 ， 记 为 3, dhe е AR RR 
子 点 集 ， 又 简称 为 单纯 形 格子 点 

单纯 形 烙 子 设计 (simplex lattice design) 根据 单纯 形 格子 点 ，Scheffe 提出 了 单纯 形 格 
子 设计 方法 ， 这 种 设计 方法 可 以 保证 设计 点 分 布 均匀 .月 加 归 系 数 的 计算 变 得 简单 ， 是 一 种 
有 效 的 混 料 设计 方法 。 设 有 ;分量 系统 ， 各 分 量 z.(i 二 1,2,…,s) 的 变化 范围 满足 约束 条 件 
Уд 一 1 ， 当 采用 4 阶 典型 的 Scheffe 多 项 式 回归 模型 时 ， 试 验 点 选 为 (s, 4) 的 Ce。 :个 格 
子 点 ， 这 正好 与 所 采用 的 4 阶 典型 的 Scheffe 多 项 式 回归 方程 中 待 估计 的 回归 系数 的 个 数 相 
等 ， 故 单纯 形 格子 设计 是 饱和 设计 ， 是 在 “试验 次 数 最 少 ”意义 下 的 最 优 设计 - 

单纯 形 重心 设计 (simplex gravity center design) 单纯 形 重心 设计 也 是 一 种 混 料 试验 
设计 方案 的 试验 点 数 等 于 相应 的 s 阶 重心 多 项 式 回归 方程 中 待 估 系数 的 个 
心 设计 也 是 饱和 设计 。 试 验 点 的 选取 方法 是 取 单 纯 形 顶点 及 它们 的 一 些 重心 
点 。 me 3. 其 单纯 形 重心 设计 共 UB 7 个 点 ; 对 S 其 单纯 形 重 心 设计 共有 15 个 点 。 对 * 因 
子 混 料 设计 系统 ， 前 面 所 说 的 单纯 形 顶 点 及 顶点 的 各 

CA C+ Ci + Фс = 

YOR з 阶 重心 多 项 式 回归 模型 时 , 应 取 这 全 部 2 一 1 个 点 作为 试验 点 。 显然, 一 、 二 阶 
单纯 形 格子 设计 与 一 、 二 阶 单纯 形 重心 设计 相同 , 当 4>2 时 ,对 于 同 阶 多 项 式 回归 模型 来 说 ， 
单纯 形 重心 设计 的 试验 点 数 要 少 于 单纯 形 格子 设计 的 试验 点 数 ， 且 4 越 大 其 差 越 大 。 

筹 价 定理 (equivalence law) 等 价 定理 是 最 优 设计 中 的 一 个 很 重要 的 定理 ， 它 说 明了 
DHS RIS G- 最 优 试 验 设计 等 价 ， 而 且 G- 最 优 试 验 设计 的 最 优 值 就 等 于 未 知 参 数 的 
个 数 ， 为 构建 DD- 最 优 实验 设计 提供 了 思路 。 

定义 关系 (defining relation) ”在 因子 设计 中 ， 可 事先 定义 某 个 效应 4 与 某 项 交叉 效应 
ZMPDW%. A=ZMPD, 这样 ,我 们 可 得 到 一 个 定义 关系 或 定义 相反 (defining contrast), 
即 7 一 ZMPDXA4=2ZMPD4。 利 用 这 个 定义 关系 ， 可 产生 所 有 其 他 别 的 各 个 同名 效应 来 。 

多 步 法 (multistep method) 多 步 法 是 数值 求解 常 微分 方程 的 一 类 方法 。 数值 求解 常 微 
分 方程 方法 的 基本 思路 是 将 时 间 变 量 离散 化 ， 即 产生 一 离散 点 序列 itio toto rs WRB 
BRB htt. RB, ERE An, 用 先前 求 得 的 值 计算 ， 并 用 该 计算 值 作为 该 时 间 
点 解 的 近似 值 。 这 样 的 方法 在 微分 方程 数值 解 方法 中 称 为 差分 法 〈 也 称 逐 步 法 或 离散 变量 
法 )。 差 分 法 提供 了 一 个 利用 上 个 先前 得 到 的 数值 yes veo эс, co еа TRH w+ 的 法 
M, RALPH. 如果 =1， 则 是 单 步 法 ， 如 果 >L WELSHE, 

二 次 饱和 D- 最 优 设计 (second-order saturated D-optimal design) 对 于 二 次 回归 模型 


у= ñ + Ba, + Ў, 
451 ©) 


试验 点 个 数 与 未 知 待 估 参 数 个 数 m[m= (* 十 1)(s 十 2772] 相 等 的 也- 最 优 设计 称 为 饱和 了 最 
优 设 计 。 有 人 证 明 ， 对 227 ROM D- 最 优 设 计 。 当 * 一 2、3 时 ， 侈 和 中 -最 优 设计 存在 ， 
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但 关于 224 HM 六 -最 优 设 计 ， 至 今 尚未 解决 . 

混杂 (confounding) 在 部 分 因子 试验 设计 中 , 主 效应 与 交叉 效应 , 或 交叉 效应 与 别 的 交 
叉 效应 会 出 现 共 有 完全 一 致 的 符号 的 现象 这 种 两 种 效 以 具有 同 - -符号 的 情况 ， 在 部 分 因子 
设计 中 ， 统 六 学 家 将 其 称 为 泡 杂 或 共 现 现象 ， 这 些 同 符号 的 效应 将 称 为 同名 或 别名 效应 。 

HHT! (conjugate direction) 共 驾 方向 为 局 部 优化 算法 中 的 一 种 重要 寻 优 方向 。 设 
A 为 一 个 (nxn) 对 称 正 定 矩阵 ，P、9 HHT n BAM. A p'Aq—0, WAR p. q HATHA 
it, 如果 A 为 一 个 单位 矩阵 ， 则 p. q 两 向 量 正 交 、 对 于 正定 二 次 ”元 冰 数 ， 如 果 依 次 沿 ” 
个 相互 共 罗 的 方向 进行 一 维 搜索 ， 则 最 后 得 色 的 就 是 它 的 最 优点 。 如 果 一 个 算法 的 搜索 方向 
ASE, WHI te. DUR ЕЛЕЕ, РРР RB BHA. 

好 格子 点 法 (good lattice point) 好 格子 点 (glp) 法 是 一 种 基于 数论 的 产 牛 网 格 点 的 方 
法 。 它 首先 从 вір 产生 表 中 取出 产生 向 量 Gas ho, eo, Ао. 为 点 集中 的 样本 点 数 ,为 所 考 
察 空 间 的 维 数 。 继 而 用 下 式 产 生 glp 集 (zo R= Le сз) nh. 
az — [Ink 0. 5) Ла), (А60. 5) /я} n (CAR 0: In] Emden RE L) RETH 
1) 中 的 小 数 部 分 。 和 由 好 格子 点 法 产生 的 格子 点 具有 很 好 的 均匀 性 。 

混 料 试验 设计 (mixture experimental design) 混 料 试验 设计 是 一 神 存 在 有 约束 条 件 的 
试验 设计 方法 。 在 化 工 、 材 料 、 冶 金 、 食 品 、 精 细 化 工 等 领域 的 产品 大 多 是 几 种 化 学 成 分 混 
合 后 加 工 制造 出 来 的 ， 它 们 的 某 项 或 某 几 项 特性 指标 与 混合 成 分 所 占 比 例 有 关 。 如 何 确定 各 
成 分 在 混 料 (或 称 配方 ) 所 占 比 例 ， 以 使 我 们 感 兴趣 的 特性 指标 在 一 定 条 件 下 达到 最 优 ， 是 
生产 和 科研 由 的 一 个 重要 问题 。 混 料 试验 设计 是 专门 针对 这 一 方面 研究 的 试验 设计 方法 .在 
混 料 问题 中 ， 试 验 的 响应 值 仅 与 每 种 组 分 的 百分比 有 关 ， 而 与 混 料 的 总 量 无 关 。 

基于 数论 方法 的 序 贯 优化 法 (sequential number-theoretic optimization method) 基 于 
数论 方法 的 序 贯 优化 法 是 一 种 将 数论 方法 (NTM), REAMER К Cquasi Monte- 
Carlo methods), 和 数值 分 析 相 结合 的 一 种 寻 优 方法 - 它 采 用 МТМ 在 搜索 空间 均匀 布点 搜索 
最 优点 ， 继 序 贯 收 缩 搜 索 空间 而 不 断 搜索 的 一 种 全 局 优化 算法 。 与 其 他 全 局 优化 算法 比 ， 
SNTO 具有 原理 清晰 上 明了， 算法 易 子 实现 等 特点 。 

交互 效应 (interactive effect) 交互 效应 是 试验 设计 中 一 个 十 分 重要 的 概念 。 在 试验 设 
计 的 建 模 过 程 中 ， 有 必要 进行 析 因 分 析 ， 如 所 研究 的 对 象 为 一 线性 模型 ， 则 主 效应 的 估计 就 
说 明了 因素 本 身 对 于 模型 影响 的 大 小 ， 可 是 ， 在 绝 大 多 数 的 实际 问题 中 模型 很 难 用 线性 模型 
表达 ， 都 存在 着 的 交互 效应 ， 即 因素 与 因素 之 间 的 交互 影 响 ， 所 以 ， 在 估价 了 它们 自身 的 主 
效应 之 后 ，-- 般 都 需要 继续 估价 交互 效应 。 

ZEREN (interaction effect tables) ”交互 效应 表 是 正 交 试验 设计 中 用 来 标明 正 交 表 
中 哪些 列 与 娜 些 交叉 项 具有 混杂 或 共 现 的 一 种 表格 。 通 过 它 人 们 可 容易 地 有 效 地 安排 正 交 
Ай. 

局 部 优化 算法 (local optimal method) 局 部 优化 算法 是 一 类 经 典 的 优化 算法 ， 由 于 它 
们 一 般 只 能 得 到 局 部 最 优 解 ， 故 有 局 部 优化 算法 之 称 。 局 部 优化 算法 中 如 按 需 不 需要 对 目标 
左 数 求 导 来 分 ,可 分 成 两 类 ,有 即 一 类 需要 对 目标 函数 f(x) 进 行 求 导 运算 ,这 样 的 方法 包括 梯 
度 法 、 牛 顿 尖 、 共 轿 梯 度 法 以 及 变 尺 度 法 ， 这 类 方法 充分 利用 了 函数 的 解析 性 质 ， 它 们 的 收 
伍 速 度 多 数 比 不 用 求 导 的 优化 方法 〈 直 接 法 》 要 快 ， 而 另 -类 则 毋 需 求 导 ， 常 称 直 接 法 ， 它 
们 是 在 化 学 计量 学 中 得 到 广泛 应 用 的 单纯 形 法 、 坐 标 轮换 法 和 Powell 方法 。 

均匀 性 准则 (criterion for uniformity) 度量 均匀 性 的 准则 很 多 ， 其 中 偏差 是 使 用 历史 


RA, 为 公众 所 广泛 接受 的 准则 . Be xy ee ax, 为 -0.1] 的 4 个 点 , Ea at r= (z .. ` 
z€[0.1] i eG) ai Xa xc Xy DERO TES EGER mI x ene x, 中 落 入 矩形 70， 
x] 的 点 数 , 则 
DG Xr x.) —max m n vl 
хЄ[0.11 
称 为 点 集 (у xs rs x 在 0. 1] 中 的 偏差 。 

均匀 设计 (uniform experimental design) 均匀 设计 是 -种 善 重 硅 试验 范围 内 考虑 试验 
点 均匀 散布 以 获得 最 多 试验 信息 的 较 新 的 试验 设计 方法 。 它 特别 适合 于 具有 较 多 水 平 的 试验 
和 对 模型 没有 先 验 信息 的 非 线性 系统 。 

均匀 设计 表 (uniform design table) 均匀 设计 与 止 交 设计 相似 , 也 是 通过 一 套 精 心 设计 
的 胡来 进行 实验 设计 的 。 类 似 于 正 交 试 验 设 计 ， 均 匀 设 计 表 一 般 用 已? 来 表示 、 其 中 = 为 
试验 次 数 ， g AAPM, s 为 因子 数 。 

龙 格 - 库 增 法 (Range-Kutta method) ” 龙 格 - 库 塔 法 是 一 种 最 常 月 的 微分 方程 的 数值 解 
法 , 它 只 需 知道 一 阶 导 数 而 手 需 明确 定义 或 计算 其 他 阶 叶 数 . 近似 值 由 若干 次 函数 求 值得 到 。 
当 步 长 A*0 时 ， 经 典 的 四 阶 龙 格 - 库 塔 法 通过 阶 为 所 的 各 项 浙 近 地 与 台 劳 级 数 法 相 了 吻合, 龙 
格 - 库 塔 尖 编程 较 易 ， 且 对 很 大 一 类 数值 计算 问题 是 十 分 稳定 的 。 

盲目 搜索 (blind search) 育 目 搜索 是 人 工 智能 中 的 -种 搜索 方法 。 在 人 工 智 能 中 ,对 于 
很 简单 的 问题 ,直接 的 方法 就 是 进行 “盲目 搜索 ”这 是 很 费时 的 办 法 ,让 计算 机 依次 产生 并 
检验 各 结 点 可 能 出 现 的 分 支 ， 随 着 搜索 过 程 的 进行 搜索 树 不 断 长 大 ,搜索 树 的 每 个 结 点 可 
KT — TAP, MALE 0 水 平 ， 接 着 是 水 平 1， 余 类 推 。 水 平 的 拟 次 代表 了 搜索 的 深度 。 
广度 优先 搜索 和 深度 优先 搜索 是 两 种 应 用 较 广 的 盲目 搜索 方法 。 

模拟 退火 法 (simulated annealing method) 模拟 退火 法 是 一 种 随机 的 全 局 优化 算法 。 
其 主要 乱 路 是 将 退火 思想 引 人 优 化 领域 ， 它 源 于 对 固体 退火 过 程 的 模拟 ， 采 用 Metropolis # 
受 准则 ， 关 用 一 组 称 为 冷却 进度 表 的 参数 控制 算法 进程 ， 使 算法 在 多 : 顶 式 时 间 里 给 出 一 个 近 
似 全 局 最 优 解 .固体 退火 过 程 的 物理 和 统计 性 质 是 模拟 退火 算法 的 基础 背景 , Metropolis 接受 
准则 使 算法 具有 跳 离 局 部 最 优 的 机 制 、 而 冷却 进度 表 的 合理 选择 是 算法 成 功 的 重要 前 提 。 

拟 水 平均 匀 设 计 (pseudo-level design) 在 一 般 的 均匀 设计 表 中 ， 各 因子 的 水 平 数 都 是 
相等 的 ， 由 于 在 实际 的 化 学 实验 和 化 工 生产 中 ， 有 时 各 个 因素 的 水 平 数 是 不 同 的 ， 需 要 使 用 
混合 水 平 设计 表 。 拟 水 平均 匀 设 计 就 是 一 种 通过 引入 所 谓 拟 水 平 技术 ,直接 用 均匀 设计 表 来 
构造 拟 水 平均 匀 议 计 表 的 一 种 针对 混合 水 平 试验 的 均匀 设计 的 方法 。 

牛顿 法 (Newton method) ”牛顿 法 是 一 种 局 部 最 优 的 、 最 古老 、 最 基本 的 算法 。 其 主要 
思路 是 对 梯度 法 的 搜索 方向 进行 改进 ， 即 加 进 日 标 函 数 的 一 阶 导 数 矩 阵 的 信息 ， 以 加 速 收 伍 
速度 。 对 于 二 次 型 目标 函数 ， 用 和 牛顿 法 只 须 迁 代 一 次 就 可 得 到 最 优点 。 对 于 非 二 次 函数 ， 由 
于 它们 在 极 小 点 附近 利 二 次 函数 很 接近 ， 使 用 牛顿 法 ， 其 收敛 速度 也 是 很 快 的 。 但 是 牛顿 法 
要 求 初始 点 选 得 比较 好 ， 如 离 最 优点 较 远 时 ， 就 容易 发 生 送 代 发 散 或 收 全 到 非 最 优点 的 情况 。 

偏差 (discrepancy) ”偏差 是 一 种 用 于 比较 点 集 在 试验 空间 的 均匀 性 的 度量 .度量 均匀 性 
的 准则 很 多 ， 其 中 偏差 是 使 用 历史 最 久 ， 为 公众 所 广泛 接受 的 准则 ， 其 定义 如 下 : х, 
хи ЯС" 的 于 个 点 ， 任 一 向 量 = Gunosic0€(0,1]" H iE убх) =r X aX 
Xr, 为 矩形 [0,z] 的 体积 ,mc 为 x exer ax, PR ABO К. ДЇ 


Dx yx20x,) = sup |n,/2— vx) | 
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x€ 0,1T 

BARR iya xo vu x. dE C0. 1T PERE. 

Powell Ж (Powell method) ”Powell 法 是 .种 局 部 最 优 算法 ,又 称 方向 加 速 法 ,其 基本 电 
路 是 利用 连 次 构造 共 邢 方向 ， 并 以 此 来 加 速 收敛 故 有 方向 加 速 法 之 称 . Powell i£ fi te 
方向 姐 需 计算 日 标 函 数 的 导数 ， 这 是 该 法 的 “个 显著 性 优点 ， 

全 局 忧 化 算法 (global optimization methods) 全 局 优化 算法 是 相对 局 部 优化 算法 的 一 
类 寻 优 方法 。 与 局 部 优化 算法 的 关键 不 同 之 点 就 在 于 它们 都 具有 跳出 局 部 优化 点 的 机 制 ， 在 
化 学 计量 学 研 究 中 ， 它 们 的 最 主要 的 代表 性 算法 有 模拟 退火 算法 、 遣 传 算法 和 基于 数论 方法 
的 序 贯 优 化 法 。 

四 分 之 一 因子 设计 法 (quarter fraction factorial design) 四 分 之 一 因子 设计 法 是 -种 
部 分 因子 设计 法 , 通常 以 2" ?的 形式 表示 出 . 因 其 与 全 因子 设计 的 试验 次 数 相 比 ,只 有 全 因子 
设计 试验 次 数 的 由 分 之 一 ， 故 有 四 分 之 一 部 分 因子 设计 法 之 称 ， 

梯度 法 (gradient method) HER RAR EDO. 是 求解 优化 问题 的 -种 最 占 老 、 服 
基本 的 局 部 最 优 算法 。 其 主要 思路 是 取 函 数 的 负 梯度 方向 (最速 下 降 方 向 ) 作为 选 代 的 搜索 方向 。 

同名 或 别名 (alias) 在 部 分 因子 设计 中 、 一些 主因 子 和 一 些 交 脆 仇 应 将 存在 重复 的 机 
会 ， 这 种 两 种 效应 具有 同一 符号 的 情况 ， 在 部 分 因子 设计 中 .统计 学 家 将 其 称 为 共 现 或 混杂 
现象 ， 这 些 同 符号 的 效应 将 称 为 同名 或 别名 效应 . 

REE dinear graph) 对 于 正 交 设计 的 试验 安排 , 除 交 互 效应 表 外 , 还 有 一 个 很 重要 的 
工具 ， 就 是 正 交 设计 表 的 线性 图 。 对 于 不 同 的 正 交 表 ， 存 在 其 相应 的 标准 线性 图 。 图 中 的 点 
及 其 由 应 的 数码 代表 正人 交 表 的 列 ， 图 中 的 连 线 及 其 相应 的 数码 也 代表 正 交 表 中 的 某 一 列 ， 只 
是 这 样 的 列 是 表示 其 线条 相连 的 两 个 点 所 代表 的 两 列 的 交互 效应 .线性 图 的 项 点 所 对 应 的 列 ， 
可 用 于 安排 试验 的 各 个 因素 。 

一 次 饱和 D- 最 优 设 计 (first-order saturated D-optimal design) -次 饱和 DD- 最 优 设计 
是 饱和 D- 最 优 设计 的 一 种 方法 。 对 于 s- 维 立方 体 一 1 所 2 дл. GSLs) 上 的 一 次 回归 
模型 ， 


у= Bot Bite Beret Bars toe + Bean 

ЖЖ GHD 个 点 组 成 实验 设计 方案 就 称 为 一 次 饱和 中- 最 优 设计 。 

遗传 算法 (genetic algorithm) 造 传 算法 最 早 由 Holland 于 20 世纪 60 年 代 创 建 ， 被 用 
于 解决 化 学 上 的 难题 。 遗 传 算法 是 一 族 用 计算 机 模拟 生物 自然 进化 过 程 随机 搜索 最 优 解 的 方 
法 。 它 引信 达尔 文 进化 论 ， 通 过 模拟 自然 界 生物 “遗传 ~ 变异 一 适 者 生存 ”的 进化 过 程 ， 对 
优化 空间 进行 随机 搜索 ， 从 而 得 到 全 局 最 优 解 。 数 值 遗 传 算法 是 将 待 优化 的 各 个 参数 排列 在 
一 起 ， 当 作 一 条 染色 体 ， 每 个 参数 即 为 染色 体 中 的 通 传 基因 ,根据 染色 体 对 环境 的 适应 性 
( 即 其 目标 函数 值 的 一 个 转换 指标 ,通过 各 种 遗传 操作 控制 其 繁殖 情况 ， 淘 涩 差 的 ， 保 留 好 
的 , 最 终 得 到 最 好 的 染色 体 , 亦 即 全 局 最 优点 ,遗传 算法 的 过 程 一 般 可 概括 为 五 个 基本 步骤 
(D 按 设 定 的 规模 产生 第 一 代 群 体 ， 群 体 中 每 条 染色 体 的 长 度 由 所 需 优化 的 参数 的 个 数 决 定 ; 
Q 评价 染色 体 的 适应 性 ， 通 过 一 定 的 方式 将 每 条 染色 体 中 的 参数 值 代 人 所 求 目标 函数 中 , 求 
出 对 应 函数 值 ; @ 将 目标 函数 值 经 过 转换 ,得 出 染色 体 的 适应 性 优先 ; 有 选择 地 交叉 染色 
体 ,每 次 随机 地 队 母 代 染 色 体 中 选 出 两 条 染色 体 ,随机 地 交换 它们 菜 些 到 应 位 置 上 的 数 段 . 从 
而 产生 下 一 代 的 新 个 体 在 选 母 代 染 色 体 的 过 程 中 ， 每 条 染色 体 被 选中 的 概率 与 其 适应 性 成 
EH): © 变异 , 按 一 定 概率 随机 地 对 染色 体 上 的 基因 进行 变异 ,由 此 可 以 产生 一 些 新 的 个 体 。 
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ВЛЯВО LE OE BERT 
子 设 计 分 辩 率 (resolution of factorial design) 14 РАУ Е ЮЕ 
的 一 个 很 重要 的 概念 ， 一 般 说 来 ， 分 辩 率 越 高 的 部 分 因子 设计 越 好 。 因 子 设计 的 分 辩 率 的 正 
HELA: 设计 的 分 辨 率 为 R 的 部 分 因 于 设计 为 p， 在 这 样 的 因子 设计 中 ,没有 p 项 交叉 效 
应 与 CR— p) 项 交叉 效应 存在 共 现 现象 。 值 得 指出 的 是 . 这 -原始 定义 由 Box 给 出 , 但 现在 
有 人 提出 ， 此 定义 还 并 不 完善 ， 需 要 修改 。 部 分 因子 设计 在 文献 中 的 表述 一 般 为 数字 或 罗马 
字 ， 例 如 对 于 25 :部 分 因子 设计 的 分 辩 率 可 表示 如 下 
(у) CR) 

上 述 符号 就 分 别 表示 分 辨 率 为 5 和 分 辨 率 为 4 的 2”! 部 分 因子 设计 。 

对 于 上 述 给 出 的 分 辩 率 ， 一 般 部 遵循 以 下 三 条 原则 : 

(D 一 个 具有 分 辨 率 为 3 Qu ID 的 部 分 因子 设计 , 其 主 效应 之 间 不 存在 共 现 现 象 , 但 是 
主 效应 一般 都 与 二 项 交叉 效应 存在 共 现 关系 。 

@ 一 个 具有 分 辨 率 为 4 (к= М) 的 部 分 因 于 设计 , 其 主 效应 之 间 不 存在 共 现 现象 , 同时 
主 效应 与 二 项 交叉 效应 也 不 存在 共 现 现象 ,但 是 主 效应 -- 般 部 与 三 项 交叉 效应 存在 共 现 关系 。 

G 一 个 共有 分 辩 率 为 5 (R= ) 的 部 分 因 于 设计 , 其 主 效 应 之 间 ， 主 效应 与 二 项 交叉 效 
应 及 三 项 交叉 效应 之 问 不 存在 共 现 现象 或 混杂 关系 ， 但 是 主 效应 与 四 质 交叉 效应 ， 二 项 交叉 
效应 与 三 项 交叉 效应 之 间 却 存在 着 混杂 关系 。 

正 交 设计 (orthogonal design) 正 交 试验 设计 从 本 质 上 来 说 , 可 以 算 成 是 一 种 部 分 因子 
设计 方法 , 因 其 主要 特征 是 基于 正 交 表 来 进行 试验 设计 和 数据 分 析 , 故 有 正 交 试验 设计 之 称 。 

正 交 设计 表 (orthogonal arrays) 正 交 设 计 表 是 正 交 试 验 设计 用 来 安排 实验 的 一 种 特 
殊 表 格 。-- 个 矩阵 的 任意 两 列 都 搭配 均衡 ， 则 称 窍 阵 4 为 一 个 正 交 表 。 这 里 称 和 矩阵 为 表 ， 因 
其 可 写成 表格 的 形式 ， 常 简 记 为 


LG; Xt Xt X Xt.) 

L 是 正 交 表 的 代号 ,来源 于 拉丁 方 这 一 试验 设计 表 的 第 一 个 字母 . ”表示 共 作 ”次 试验 ， 
Ti 1G 1,2; 00 AGRAR ; 列 由 个 水 平 组 成 。 如 所 有 4 均 相 等 , WT LLG), RA 
+ 水 平 正 交 表 。 如 两 列 水 平 数 不 相 等 时 , 则 称 为 混合 型 正 交 表 。 用 正 交 表 来 安排 试验 , 可 以 达 
到 以 很 小 的 试验 次 数 来 最 大 限度 的 获取 有 关 各 因素 主 效应 及 交叉 效应 的 信息 。 

ERE (main effect) 在 试验 设计 中 , 每 一 种 实验 因素 对 于 实验 结果 的 贡献 ,就 称 为 试 
验 效果 的 主 效应 。 它 们 可 通过 方差 分 析 得 到 ， 也 可 通过 回归 分 析 得 到 。 

最 优 试验 设计 Optimal design) 最 优 试验 设计 是 一 类 试验 设计 的 方法 。 它 们 以 一 个 最 
优 指标 为 其 试验 设计 的 目标 来 构建 试验 设计 点 ,其 中 忆 - 最 优 设 计 是 统计 学 中 应 用 最 广泛 的 一 
种 最 优 试验 设计 方法 。 

坐标 轮换 法 (coordinate changing method) 坐标 轮换 法 是 -- 种 局 部 最 优 算法 .对 子 * 维 
实数 空间 的 目标 函数 AGO ,其 算法 的 基本 思路 就 是 依次 沿 其 = 个 坐标 轴 方 向 进行 一 维 寻 优 ， 
经 多 次 循环 选 代 后 以 达到 最 优 解 。 


第 三 节 多 元 校正 与 多 元 分 辩 
不 等 性 方差 《heteroscedastic variance) 不 等 性 方差 噪声 是 指 量 测 噪声 随 分 析 信 号 大 小 


而 变化 ， 分 析 信 号 大 的 量 测 噪声 也 大 ， 例 如 在 紫外 可 见 光谱 和 质谱 的 量 测 中 ， 量 测 噪声 的 绝 
对 值 在 一 定 范围 中 随 量 测 信号 而 增 大 。 这 种 噪声 就 是 不 等 性 方差 噪声 ， 其 方差 在 不 同 的 量 测 
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点 上 的 方差 是 不 同 的 。 在 多 元 校正 和 多 元 分 辨 中 要 加 以 注意 。 

HWA (breakdown point) 为 评价 统计 方法 的 稳健 性 ，Hodges 引信 了 崩溃 点 的 概念 。 
一 般 说 来 ， 骨 省 点 的 概念 可 解释 为 强 询 影响 估计 偏离 其 “实际 ”情况 的 最 小 的 奇异 点 数 与 估 
计时 所 包含 点 数 的 比值 . 最 小 二 乘 估计 的 崩 泪 点 是 n 这 就 是 说 , 只 要 在 4 个 量 测 点 中 有 -… 
个 是 奇异 点 ， 它 就 可 以 完全 琶 坏 最 小 二 乘 估计 。 如 果 存 在 坏 代 盾 点 ， 最 小 一 乘 的 出 省 点 也 胰 
1/a! 

病态 体系 〈I 11-conditioned system) ”在 直接 多 元 校正 的 模型 中 隐 含 着 一 个 假设 ， 即 不 
同 的 化 学 物质 的 最 测 谱 是 不 同 的 ， 即 校正 秆 阵 X 必须 是 一 个 满 秋 矩 阵 。 下 是 ， 在 分 析 化 学 的 
实际 中 往往 存在 着 这 样 的 情况 ， 在 某 些 光谱 (如 最 常用 的 紫外 可 见 湛 》 的 量 测 中 ， 有 些 不 同 
的 化 学 物质 〈 如 某 些 异 构 体 ) 却 具有 很 相似 的 光谱 ， 虽 然 它们 的 光谱 多 少 有 些 不 同 ， 但 却 恬 
常 相似 ， 这 就 会 使 校正 矩阵 了 接近 亏 秩 ， 而 使 满 秩 条 件 很 难保 证 , 或 者 说 纯 物 质谱 之 间 的 益 
别 已 与 量 测 误差 相近 ， 这 样 的 情况 在 数学 上 称 之 为 病态 。 这 样 的 分 析 体系 称 为 病态 体系 。 
标准 加 入 和 迭代 目标 转 接 央 子 分 析 法 (standard addition iterative target transformat- 
ion factor analysis) “经典 分 析 化 学 中 经 常 采 用 标准 加 和 人 法 ,以 克服 基体 或 底 液 对 分 析 校 下 的 
影响 。 事实 上 , 标准 加 入 的 方法 同样 可 推广 到 多 元 校正 的 情况 。 多 元 线性 回归 和 Kalman 滤波 
算法 都 是 首先 得 获得 校 止 所 需 的 敏感 度 矩 阵 或 是 各 物种 的 标准 谱 , 如 朵 事先 无 法 获得 标准 谱 ， 
即 由 于 待 测 样本 的 基体 条 件 不 清楚 ， 无 法 找到 标准 谱 的 量 测 条 件 时 ， 即 可 采用 通用 标准 加 入 
法 来 进行 多 元 校正 。 通 用 标准 加 入 法 的 实质 是 在 待 测 多 组 分 体系 中 直接 如 入 多 种 待 测 标准 物 ， 
以 构成 一 个 新 的 景 测 和 矩阵 , 再 从 这 新 的 量 测 矩 阵 求 得 在 此 基体 溶液 中 的 各 标准 物 的 标准 景 测 谱 . 继 
用 求 得 的 标准 谱 对 待 测 多 组 分 体系 进行 直接 校正 ， 即 可 求 得 此 多 组 分 体系 蕊 各 组 分 的 浓度 。 

残 差 双 线性 分 解法 (residual bilinearization) 残 差 双 线性 分 解法 是 一 种 多 元 校正 方法 。 
基本 思路 仍 是 利用 双 线性 纯 组 分 抢 阵 秩 为 1 A SERIE А ЖИ ТИИТ ЖЕРЕ 
式 了 一 ci сх, te te X БЕТЕ RR BEY RAB. — BAM OX. T= 
1,，2，"…*,n), 另 一 部 分 为 未 知 干扰 背景 RR， 继 交替 对 数据 进行 两 步 分 析 ， 首先 在 固定 背景 的 
基础 上 对 分 析 物 进行 校正 ;然后 图 定 得 到 校正 的 分 析 物 相对 浓度 . 对 干扰 背景 进行 主 成 分 分 
解 。 经 不 断交 玲 进 行 上 述 两 个 过 程 ， 直 至 背景 干扰 的 分 解 可 在 已 知 主 成 分 数 的 基础 上 完全 分 
解 ， 且 校正 的 分 析 物 相对 浓度 达到 收敛 。 

RE (power method) 乘 畦 法 为 一 种 快速 简便 的 求 取 特 征 值 和 特征 向 量 的 数值 算 
ж. 实质 上 它 与 化 学 计 景 学 中 常用 的 非 线性 迭代 偏 最 小 二 乘 算法 ， 亦 称 MIPALS 算法 是 同一 
的 。 它 通过 先 代 方法 来 通 近 特征 向 量 的 同时 又 得 到 特征 值 。 一 般 说 来 ， 对 于 特征 值 差别 较 大 
的 特征 向 量 , 收 敏 速度 很 快 , Ж 10~20 次 一 般 即 可 收敛 ,但 当 接近 量 测 噪声 所 对 应 的 特征 
向 量 时 ， 因 它们 的 特征 值 相差 较 小 ， 收 敛 速度 将 显著 减 慢 ， 有 时 甚至 很 难 收 得， 故 在 算法 中 
常 采用 固定 选 代 次 数 的 办 法 ， 如 通常 定 为 30 次 ， 来 终止 迷 代 。 

纯 分 析 信号 (net analytical signal, NAS) 纯 分 析 信 号 由 Lorber 提出 ， 用 来 定义 化 学 
计量 学 中 多 元 校正 的 各 类 分 析 化 学 中 常用 的 品质 因 煞 。 其 物理 意义 为 分 析 物 量 测 矢 量 在 共存 
干扰 矢量 正 交 补 空间 的 模 ， 可 看 成 是 扣除 共存 干扰 矢量 后 的 分 析 物 的 纯 分 析 信 号。 

纯 分 析 物 种 的 秩 (пет analyte rank, NAR) 在 张 量 校正 中 表示 待 测 物种 的 纯 分 析 物 种 
HK ELA 


NARy=rank(M)-rank(M|N) 5 
次 轴 (secondary axes) 次 轴 是 由 Malinowski 提出 的 因子 分 析 误差 理论 中 一 个 重要 福 
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您 ， 表 直属 于 纯粹 出 量 测 误差 而 引出 的 那 部 分 特征 向 提 所 组 成 的 因子 轴 ， 一 般 说 来 它们 所 对 
应 的 特征 值 都 很 小 Malinowski 将 它们 称 为 次 铀 。 

抽出 误差 (extracted error, XE) 在 因 于 分 析 中 . 量 测 误 差 被 分 为 防 项 , BOT RY A 
误差 GRO 和 抽出 误差 (XE)。 其 中 抽出 误差 (XE) 表示 属 十 纯粹 由 量 测 误 差 而 引出 的 那 部 
分 特征 向 量 所 组 成 的 因子 轴 , 即 次 轴 之 中 , 属 填 可 用 因子 分 析 方 法 剔除 的 那 部 分 误差 。 同 时， 
它 与 党 人 误差 UE) 和 量 测 误差 即 真 实 误 益 (RE) 的 关系 ,可 由 ~ 勾 股 定理 的 方式 表示 , ВИ 

(REY S UEY + (XE) 

固定 尺寸 移动 窗口 渐进 因子 分 析 法 (fix-sized moving window evolving factor analy 
sis) 国定 尺寸 移动 窗口 渐进 因子 分 析 法 是 用 十 求 联 用 色谱 产生 的 二 维 数据 局 部 化 学 秩 的 一 
种 局 部 因子 分 析 方 法 。 其 思路 相当 简单 , 反 渐 进 因子 分 析 法 逐步 扩大 主 成 分 分 析 窗 口 的 做 法 ， 
它 却 周 定 -~ 个 窗口 的 尺寸 ， 只 是 不 断 将 此 窗口 从 二 维 数据 的 起 点 移 向 终点 ， 从 而 得 到 一 个 特 
征 值 的 对 数值 对 保留 时 间 的 作 图 ， 以 得 到 二 维 色谱 数据 在 保留 时 间 方 向 的 信息 。 

窗口 因子 分 析 法 (window factor analysis, МЕА) 窗口 因子 分 析 法 是 一 种 多 元 分 辨 方 
法 ,其 主要 思路 是 利用 一 个 只 有 Ge 1) 个 物种 的 “窗口 ”的 信息 .从 而 求 出 相对 应 的 第 ”个 
物种 的 纯色 谱 ， 以 达到 分 辩 的 日 的 。 

等 性 方差 (homosccdastic variance) ”等 性 方 关系 指 品 声 的 标准 偏差 在 数据 中 是 处 处 相 
等 的 .一段 线性 回归 模型 都 有 这 种 假设 。 

得 分 矩阵 (score matrix) ”对 数据 阵 进行 奇异 值 分 解 后 ,一 般 可 得 到 三 个 矩阵 , 其 中 那个 
询 正 交 的 矩阵 存 化 学 计量 学 中 常 称 为 得 分 矩阵 。 一 般 说 米 ， 得 分 矩阵 反映 了 样本 与 样本 之 闻 
的 关系 。 

和 迭代 目标 转换 因子 分 析 法 (iterative target transformation factor analysis,ITTFA) Ж 
代目 慰 转 换 因 子 分 析 法 是 一 种 多 元 分 辨 方法 ， 其 主要 思路 是 利用 主 成 分 分 解 的 抽象 矩阵 来 进 
行 适 代 ， 以 求 得 一 个 通 近 的 可 能 解 ， 从 而 达到 分 辨 的 目的 。 

多 元 校正 (multivariate calibration) 多 元 校正 是 通过 利用 化 学 量 测 谱 的 多 变量 信息 ， 
来 对 林 知 混合 物体 系 进行 浓度 校正 的 一 种 化 学 计量 学 方法 。 对 子 白 色 分 析 体系 ， 它 叮 分 为 直 
接 多 元 校正 、 间 接 多 元 校正 、 广 义 标准 加 入 法 和 广义 内 标 校正 法 。 

多 元 分 辨 (multivariate resolution) 多 元 分 辩 是 针对 二 维 或 更 高 维 分 析 数 据 进 行 杰 知 
物 分 析 的 化 学 计量 学 方法 。 例 如 ， 通 过 利用 可 产生 二 维 数据 的 一 类 仪器 产生 的 数据 ， 包 括 联 
用 色谱 或 者 二 维 荧光 仪 ， 可 对 未 知 混合 物体 系 进行 组 分 数 的 测定 ， 还 可 进一步 对 复杂 的 未 知 
多 组 分 体系 进行 定性 定量 分 析 。 这 种 方法 主要 用 来 解析 黑色 分 析 体系 。 

多 元 线性 回归 方法 (multiple linear regression) 多 元 线性 回归 方法 为 基于 最 小 二 乘 估 
计 的 统计 解析 方法 ， 可 对 线性 模型 的 林 知 参数 进行 估计 、 其 一 种 直接 校正 方法 ， 也 可 用 于 定 
量 结 构 与 活性 关系 的 研究 。 

非 线 性 迭代 人 篇 最 小 二 陛 算 法 (nonlinear iterative partial least squares, NIPALS) 3E 
性 选 代 偏 最 小 二 乘 算 法 荐 乘 短 法 的 一 种 变种 ， 是 化 学 计量 学 中 常用 的 一 种 用 来 求 特征 值 和 特 
征 向 量 的 有 效 算法 。 

杠杆 点 leverage point) 杠杆 点 在 统计 学 中 又 称 为 强 影 响 点 。 它 是 遂 过 俗称 为 帽子 年 
阵 的 H EBE CH TX OCIO XO 的 对 角 元 素 有 来 定义 的 , 一般 说 来 、 当 如 大 于 它 的 平均 值 的 
2 倍 或 3 售 时 , 可 认为 第 i 个 量 测 值 所 对 应 的 x 是 个 强 影 响 点 或 称 为 杠杆 点 . 杠杆 点 其 有 很 
蝇 的 相 万 掩 柄 效应， 使 得 在 进行 回归 诊断 时 ， 由 于 杠杆 点 的 存在 ， 可 造成 很 多 假象 而 掩 苹 真 
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正 的 奇异 点 和 杠杆 点 。 

ГУ ART AT ETE (generalized rank annihilation factor analysis) J” MPAA A 
子 分 析 法 是 -- 种 多 元 校正 方法 其 主要 思路 是 将 秩 消 失 因子 的 计算 问题 转变 成 为 广义 特征 广 
程 求 解 的 问题 ,从 而 使 得 秩 消失 因子 分 析 法 不 再 局 限于 一 次 只 能 测 一 个 待 测 分 析 物 的 约束 ,此 
外 ， 该 法 还 可 拓 广 至 其 他 类 型 的 情况 

BF (momentum factor) 在 人 工 神 经 网 络 中 最 主要 就 是 确定 连接 权重 ，RumeL- 
hart 等 人 提出 了 多 层 前 传 网 络 误差 反 传 算法 (BP 算法 ). 它 根据 误差 反馈 过 来 的 情况 以 调节 网 
络 的 连接 权重 ， 从 而 达到 优化 目的 . 一 般 都 是 用 So, обн, 来 调节 权重 . ТЕЙ. 为 步 长 央 
F, 可 在 (0~1) 之 则 取 值 ; x 为 第 ;节点 上 的 抽象 变量 ,一 般 为 输出 层 或 是 隐 瑞 层 的 告 息 ， 
6 为 梯度 因子 。 步 长 因子 的 到 值 大 小 对 收敛 速度 有 很 大 的 影响 ,如 果 到 值 太 大 . 旭 可 能 引起 
迁 代 过 程 的 振 葛 ， 反 之 ， 若 取 值 太 小 则 会 导致 权重 调节 的 选 代 过 程 收 伍 太 慢 。 一 般 说 来 ， 为 
TMRAEKURAD LERNER. ТЕ ло одн, 中 引信 一 个 惯量 内 子 4。 而 使 得 

Aw, Са 1) = plu, + AN (a) 


以 保证 选 代 收敛 速 度 。 

荷载 矩阵 (loading matrix) 任 一 实数 矩阵 经 奇异 值 分 解 后， 训 得 三 个 矩阵 ， 即 

х" =USV 

其 中 ,矩阵 Jg ЕЕ. EFEZ PU BRR ӘН. 

活性 函数 (activation function) EATHAR AR i ST BAB SBME RRS 5 
输出 层 都 需 通 讨 一 个 活性 函数 1, ) 把 它们 联系 起 来 。 活 性 函数 一 般 可 以 取 以 下 儿 种 形式 : 

CD ES Ж EGO =sgn(u) =f, GO 

ou 为 正 数 时 , 取 1, 否 则 最 一 1 ,此 函数 用 子 处 理 模式 识别 问题 时 很 有 用 。 

Qs 型 非 线性 函数 EGO = 01-е = LG) 
输出 值 介 于 0~1 之 间 , 进 行 非 线性 校正 或 预测 时 很 有 用 。 
ОЗРЕН E E Mt EGO tanh GO 
其 输出 值 在 十 1 和 一 1 之 间 ， 对 模式 识别 和 非 线 性 回归 或 预测 都 可 月 。 
MAB NII ЕНК (weighted least squares regression) 加 权 最 小 二 乘 回归 法 是 一 种 
专门 针对 在 量 测 中 存在 不 等 性 方差 的 多 元 校正 方法 。 因 为 最 小 二 乘 回 归 和 和 Kalman 滤波 法 一 
般 都 假设 量 测 误 差 基 服从 零 均等 方差 的 正 态 分 布 ， 然 而 ， 在 分 析 化 学 的 量 测 中 ， 有 时 这 一 假 
设 并 不 可 能 满足 ， 即 量 测 值 在 不 同 的 量 测 范围 内 ， 量 测 精度 往往 不 同 ， 因 而 基 测 误差 也 不 尽 
相同 。 这 种 情况 在 光谱 分 析 中 很 常见 。 加 权 最 小 二 乘 回 归 法 的 基本 思路 就 是 对 不 同 的 误差 项 
e^ 加 不 同 的 权 ， 即 将 目标 函数 改 为 O = ше, 这 样 ,当量 测 值 的 精度 高 时 ,re K. RZ, 
zu 小。 这 样 可 以 使 拟 合 的 曲线 非常 接近 了 精度 高 的 点 、 保 证 拟 合 的 准确 度 高 。 
交叉 校 验 法 (cross validation) 交叉 校 验 法 是 一 种 很 有 效 的 模型 校 验方 法 , 在 统计 学 中 
又 称 为 刀 切 法 。 其 主要 思路 是 通过 多 次 日 除 一 个 或 多 个 训练 集 的 样本 建 模 ， 继 以 由 此 而 得 的 
模型 来 预测 被 删除 的 一 个 或 多 个 样本 ， 遍 历 所 有 被 删除 的 样本 后 得 到 它们 的 总 预测 误差 ， 就 
以 此 作为 模型 校 验 和 选择 的 依据 。 在 化 学 计量 学 中 一 般 用 来 确定 主 成 分 分 析 和 偏 最 小 二 乘 的 
EATA. 

经 典 诊断 方法 (classic diagnostic methods) 诊断 方法 主要 是 研究 那些 对 最 小 二 乘 估计 
有 较 大 影响 的 奇异 点 的 特性 ， 旨 在 找到 一 种 作 图 或 计算 方法 来 直接 先 将 这 些 奇异 点 或 强 影响 
点 检 出 , 以 消除 它们 对 回归 参数 估计 的 影响 。 而 经 典 诊断 方法 主要 是 基于 一 些 非 稳健 估计 , 如 
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KUR RI ЗЕ. БИН ШКО ЗЕНИТ. МЕКТЕ THAR 断 方法 之 
称 。 常 用 的 经 典 诊 断 方法 有 用 曲子 矩阵 H 诊断 强 影 响 点 或 村 盾 点 ， 用 4, EBB By A Cook 距离 
诊断 奇异 点 等 。 

间接 校正 方法 (indirect calibration methods) 间接 校 止 方 法 是 … -类 多 元 校正 方法 的 总 
称 。 其 基本 特征 是 用 -- 些 已 知 浓度 的 混合 物 经 某 种 实验 设计 方法 首先 构成 -校正 矩阵 Y， 然 
后 ,利用 这 校正 矩阵 找 则 这 些 混合 物 量 测 洪 所 对 应 的 各 组 分 纯 物种 的 量 测 谱 СКЕ PERO 或 
是 利用 它 找到 混合 物 量 测 谱 与 各 混合 物 浓度 的 一 种 线性 关系 P- 逢 阵 法 ， 主 成 分 回 内 ， 偏 最 
DZ 这 样 一 类 方法 因 其 个 直接 采用 纯 物 种 的 标准 量 测 谱 米 进行 校正 ， 故 统称 为 间接 校正 
Jk. 因 间 接 校正 方法 是 用 混合 物 量 测 谱 来 直接 估计 末 知 混合 物 基 测 谱 的 各 组 分 浓度 , 所 以 ， 
有 - - 定 减轻 非 线性 因素 的 功效 。 但 因 间 接 校正 方法 仍 是 采用 线性 模型 ， 所 以 对 于 严 重 非 线性 
分 析 体系 从 不 可 能 得 到 令 人 满意 的 结果 

局 部 因子 分 析 (local factor analysis) АЗ -种 强调 对 数据 矩阵 的 局 部 结构 
进行 分 析 的 因子 分 析 方 法 。 它 与 全 局 因子 分 析 的 不 同 之 点 就 在 于 它 不 是 对 整个 数据 矩阵 来 进 
行 因子 分 析 ， 而 是 只 对 部 分 感 兴趣 区 域 进 行 因 子 分 析 、 如 对 选择 性 区 域 进行 因子 分 析 就 是 一 
ЛАР. 

渐进 因子 分 析 法 Cevolving factor analysis) ”新 进 因 子 分 析 法 是 -种 多 元 分 辩 方 法， E 
巧妙 地 利用 了 二 维 数据 的 一 个 重要 化 学 特点 ， 即 化 学 物质 在 很 多 情况 中 的 依次 出 现 特性 ， 具 
有 这 样 特性 的 二 维 数据 包括 联 用 色谱 〈 如 GC TR, HPLC-DAD. GC- MS 等 数据 、 滴 定 光 谱 
数据 (如 在 不 同 pH 值 的 光谱 )、 动 力学 光谱 数据 等 . 渐进 因子 分 析 法 的 思路 很 简明 ， 它 利 用 
主 成 分 分 析 所 得 的 特征 值 为 其 基本 出 发 点 ， 不 同 之 处 只 是 逐步 渐进 地 延 拓 至 整个 矩阵 Mot 
得 到 各 物种 在 该 数据 矩阵 中 的 出 现 点 和 消失 点 。 

矩阵 校正 方法 (matrix calibration methods) 在 化 学 计 量 学 的 多 元 校正 和 多 元 分 辩 中 . 
求 得 的 解 是 否 唯一 依赖 于 从 分 析 仪 器 所 得 的 数据 维 数 ，-- 般 说 来 ， 分 析 仪 器 所 得 的 数据 维 数 
Ra. WANE ASRS, HUES CREM SOS BEE RE (BERD. ИЖ 
(二 阶 张 量 ) 和 三 阶 张 量 的 不 同 算法 ,人 在 多 元 校正 中 凡 属 基于 矩阵 类 型 的 数据 的 算法 都 统称 为 
条 阵 校正 方法 。 如 对 于 灰色 体系 ， 只 有 短 阵 校 止 方法 可 得 到 唯 -- 解 。 

Б HA (matrix resolution methods) 由 于 在 化 学 计量 学 的 多 元 校正 和 多 元 分 辨 
中 ， 可 求 得 的 解 是 否 唯一 依赖 于 从 分 析 仪器 所 得 的 数据 维 数 ， 一 般 说 来 ， 分 析 仪器 所 得 的 数 
据 维 数 越 高 ， 则 得 到 的 信息 将 越 多 ， 所 以 在 多 元 校正 和 多 抑 分 辨 中 ， 有 基于 失 量 〈 一 阶 张 
ш), EBE (二 阶 张 量 ) 和 三 阶 张 量 的 不 同 算法 。 在 多 元 分 辩 中 凡 属 基于 和 矩阵 类 型 的 数据 的 算 
法 统称 为 矩阵 分 辨 方法。 

无 -矩阵 法 (K-matrix method) KABBEH MAE REDE. 其 主要 思路 是 先 通 过 沦 
合 物 的 校正 矩阵 借 最 小 二 乘法 求 得 各 组 分 的 纯 物种 谱 ， 然后 再 利用 如 此 求 得 的 纯 物 种 谱 去 求 
得 未 知 待 测 混合 物 的 各 组 分 的 淋 度 。 这样 做 有 两 个 好 处 : D 因 各 组 分 的 纯 物 种 谱 是 由 混合 物 
的 校正 矩阵 求 得 , 故 有 一 定 的 抗 非 线性 功效 ; 2) 因 校 还 矩阵 可 自行 确定 ， 故 可 很 方便 进行 实 
验 设计 。 帮 -矩阵 法 的 缺点 是 它 必须 进行 两 次 求 着， 这 将 使 误差 传递 扩大 。 

Kalman 滤波 (Kalman filtering) Катап WS 9 4E 38 rp — Bp k tk ТЕЕ WE UE QUT 
法 ， 因 属 递 推 工法 。 具 有 计算 速 庆 快 是 所 需 计算 机 内 存 少 的 特点 ， 故 在 工程 实践 中 ， 特别 在 
航空 空间 技术 中 得 到 广泛 应 用 . Kalman 滤波 引 人 化 学 计量 学 后 ， 在 分 析 化 学 计量 学 的 多 元 校 
正中 得 到 广泛 的 应 用 。 Kalman 滤波 算法 在 化 学 中 可 用 于 很 多 方面 ， 如 化 学 动力 学 的 速率 常数 
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的 测定 ， 非 平移 状态 的 电位 滴定 ， 多 组 分 化 学 体系 的 直接 校正 等 . EERIE. Kalman ik 
波 法 是 一 种 真 接 校 正方 法 。 

岭 回归 法 (ridge regression) 与 基于 最 小 二 乘 的 多 元 线 作 回 归 不 同 , 岭 回 时 是 一 种 有 偏 
统计 回归 算法 ， 其 基本 公式 为 : 

с (下 于 十) 

AEX 为 直接 校正 矩阵 ,》 为 混合 物 的 量 测 矢量 ,ck) 为 混合 物 的 浓度 估计 矢量 ,1 为 (x хл) 
MAMER WSR. H T ERUSLA we el А T fo] TREH BG BUSH HIS 
特点 , 故 称 为 有 偏 估计 。 

WUE (ridge trace plot) 岭 迹 图 是 根据 式 CC = (XX LED) X'y, Шс ETUR 
ERRETIRA. Me EIA F — AR BE AR ALO E ЖЕР k TES 

M-M&ibik (M-estimation) М 估计 是 一 类 极 大 似 然 估计 的 简称 。 其 主要 思路 也 是 改变 
估计 的 最 小 二 乘 回归 的 目标 两 数 。 反 最 小 一 乘 估计 用 残 差 平 方 和 作为 月 标 郑 数 的 做 法 ， 它 重 
HELT TARER: 


Min р>) 
式 中 的 p(. )з—Ю „ИШ p( -D =p) Fée SPENT B BUG. WELPEN 
PO ›@ Ва З, KR E MT RAR Y ABTT ERE o aR. AFR 
M IYF Ж ЖЕ P А. MI ERRAR E -RRRA BH 
о [e wy NTE yy 
TB xf fie wes ЖН Vv 函 数 所 确定 。 

帽子 矩阵 (har matrix) 幅 子 矩阵 是 统计 学 回归 诊断 中 一 个 很 重要 的 松 念 。 在 y=Xa 的 
线性 回归 模型 中 ,帽子 和 矩阵 可 定义 为 H=X(X'X)  X'. xt Bl ze Br DURO MR EAE E E. 
为 它 可 直接 将 量 测 矢 量 y 转换 成 为 最 小 二 乘 的 估计 值 , 即 

y—Hy-XO'X) IX'y=Xa 
WAE ET JH РӘТЕН АЙТ 0 TRE a Ж EE 

P-S$EREGE (P-matrix method) Р ЖЕ C= PY 为 其 数学 模型 . ERE IE RE PER 
浓度 阵 为 项 测 目标 ， 求 得 回归 系数 年 阵 PARA AE RAT HER MS I К 
Ж, ОН Я ТРИО МЕ, ЕМЕТ К-ЗА. 

偏 最 小 二 乘法 (partial least squares) ” 主 成 分 回归 方法 的 主要 思想 是 直接 对 混 介 物 量 
MERE У 进行 正 交 分 解 ， 继 而 用 浓度 矩阵 C 对 被 分 解 的 正 交 主 成 分 进行 回归 。 偏 最 小 二 乘法 
则 更 进一步 , 它 不 但 对 混合 物 量 测 矩 阵 Y 进行 正 交 分 解 ,而且 企 分 解 了 的 同时 将 浓度 矩阵 C 也 
进行 正 交 分 解 ， 这 样 浓度 矩阵 的 主 成 分 也 被 分 离 出 来 : 

Y=USV'=U*S*V' +E,=T'V'' E, 

C=PGQ'=P'G' Q" +E-=R' Q —E; 
Ж, Bd Y RUNG EE Y 分 解 得 到 的 矩阵 了" D E tk BE EBE C 分 解 得 到 的 矩阵 К”. (OR 
了 除去 大 部 分 噪声 后 的 响应 和 浓度 的 信息 。 而 且 , PEE TTT ЕВ. ЖЕТЕТ: 和 和 矩阵 
RR 之 间 应 有 的 线性 关系 ,这 就 构成 了 偏 最 小 二 乘法 不 同 于 主 成 分 回归 的 主要 之 点 , 即 在 分 解 
EBE Y 时 考虑 矩阵 C 的 因素 ， Md ea 交互 效 验 相互 影响 . 通 
过 先 代 时 交换 迭代 矢量 而 使 两 个 分 解 过 程 合 。 偏 最 小 二 乘法 是 化 学 计量 学 中 应 用 得 最 
广泛 的 一 种 方法 。 

全 局 因子 分 析 法 (glohal factor analysis) 全 局 因子 分 析 法 是 简单 利用 整个 量 测 矩 阵 来 


进行 因子 分 析 欧 方法 。 它 基本 不 利用 量 测 和 矩阵 的 局 部 性 质 - 

前 传 网 络 误差 反 传 算法 (back propagation. BP 算法 ) 前 传 网 络 误差 反 传 算法 是 人 工 
神经 网 络 在 化 学 计量 学 中 应 用 较 广 泛 的 -种 方法 。 这 -算法 在 模式 识别 及 非 线性 回归 方面 得 
到 了 广泛 的 应 用 ,所 谓 误差 反 传 的 基本 思路 就 是 定义 一 个 误差 函数 作为 训练 网 络 的 日 标 函 数 ， 
然后 采用 一 种 方法 根据 误差 反馈 过 来 的 情况 以 调节 网 络 的 连接 权重 ， 从 而 于 到 优化 目的 。 

人 工 神经 网 络 (artificial neural networks) 人 工 神经 网 络 的 研究 从 20 世纪 50 E PUR, 
60 年 代 初 开始 ,代表 性 工作 是 Rosenblatrd 的 感知 器 (perceptron) Ж. Widrow 的 和 白 适应 线性 
ж, RARA 30 余年 历史 。 特 别 是 80 FALL. DIE Hopfield 等 人 的 联想 记忆 网 络 模型 、 制 
级 优化 网 络 模型 、Rumelhart SAW SIE AE AREER (BP 算法 ) 等 为 代表 的 - 批 
优秀 工作 的 出 现 ， 推 动 了 人 工 神 经 网 络 研究 。 人 工 神经 网 络 其 有 很 强 的 非 线性 映照 能 力 ， 是 
发 展 较 快 的 化 学 计量 学 研究 领域 。 人 工 神经 网 络 的 基本 思路 是 基于 人 脑 细胞 神经 元 的 工 
作 不 理 来 模拟 人 类 思维 方式 ， 以 建立 模型 来 进行 分 类 与 孩 测 的 人 工 神经 网 络 方法 模拟 人 脑 
的 神经 元 通过 神经 纤维 或 突 触 与 别 的 神经 元 相 联 系 ， 用 以 接受 米 自 别 的 神经 元 的 信息 ， 并 
将 信息 继续 传 给 别 的 神经 元 的 网 络 系统 ， 借 用 神经 大 来 表 水 一 个 计算 单元 ， 它 也 可 以 像 神经 
元 一 样 通过 网 络 与 别 的 计算 单元 相连 ， 构 成 网 络 系统 ， 以 达到 非 线 性 映照 的 能 力 。 人 工 神经 
网 络 的 方法 既 可 用 于 校正 ， 又 可 用 子 化 学 模式 识别 。 

s 型 非 线性 函数 (sigmoid nonlinearity function) 在 人 工 神经 网 络 的 计算 中 ， 其 输入 层 
与 隐蔽 层 或 隐蔽 层 与 输出 层 都 需 通 过 一 个 活性 函数 С т СПЕ АЕК. в DESIT 
(Sit BRE RS ASHER. ED E OR а = Ute) G0 ,其 输出 什 
介 于 0-3 之 间 ,进行 非 线性 校正 时 很 有 用 。 

投影 旋转 因子 分 析 法 (projection rotation factor analysis, PREFA) 投影 旋转 因子 分 析 
法 是 针对 相 分 辨 荧光 光谱 仪 (PRFS) 所 产生 的 三 维 数 据 的 解析 型 提出 的 ， 是 一 种 基于 张 量 数 
据 的 多 元 分 辨 方法 。 其 主要 思路 仍 是 基于 因 于 分 析 法 ， 不 同 的 是 它 巧 妙 地 利用 了 张 量 数据 的 
性 质 来 进行 投影 旋转 ， 从 而 可 获得 有 物理 意义 的 唯一 解 、 

通用 标准 加 入 法 (generalized standard addition method? 经 典 分 析 化 学 中 经 常 采 用 标 
准 加 入 法 ,以 克服 基体 成 底 液 对 分 析 校 正 的 影响 。 事 实 .上 ,标准 加 人 的 方法 同样 可 推广 到 多 元 
校正 的 情况 .通用 标准 加 人 法 的 实质 是 在 待 测 多 组 分 体系 中 直接 加 和 人 多 种 待 测 标准 物 ,以 构成 
一 个 新 的 量 测 和 矩阵, 再 从 这 新 的 量 测 些 阵 求 得 在 此 基体 溶液 中 的 各 标准 物 的 标准 量 测 谱 ,继而 
用 求 得 的 标准 谱 对 待 测 多 组 分 体系 进行 直接 校正 , 即 可 求 得 此 多 组 分 体系 的 各 组 分 的 浓度 。 

稳健 主 成 分 回归 (robust principal component regression) 稳健 主 成 分 回归 是 通过 对 主 
成 分 回归 进行 稳健 化 而 得 。 其 中 一 个 例子 是 由 Walczak 和 Massart 提出 的 一 个 稳健 主 成 分 回 
In (RPCR)， 它 总 在 构造 一 种 奇异 点 的 稳健 检 出 方法 。 DERE IURE FU FERRE HENE 
(MVD 来 得 到 一 个 稳健 的 离 差 矩阵 ， 继而 在 此 无 奇异 点 干扰 的 离 郑 定 阵 上 进行 主 成 分 分 析 
以 检 出 天 矩阵 的 奇异 点 ， 构 成 此 稳健 主 成 分 回归 法 的 第 -… 步 。 接 郑 ， 采 用 最 小 中 位 方差 估计 
(MS). 法 所 得 的 标准 化 残 差 来 检 出 基 测 矢量 》 中 的 奇异 值 。 

稳健 偏 最 小 二 与 法 (robust partial least squares) ЕЛУ ЕЛИ (PLS) 为 化 学 计量 
学 中 一 种 最 常用 方法 。 将 其 稳健 化 则 成 了 稳健 篇 最 小 二 乘法 . 如 将 PLS 方法 中 的 对 下 ALY N 
阵 的 荷载 矢量 w Жс 的 估计 过 程 稳健 化 , 结果 表明 , 对 于 Y 矩阵 中 的 奇异 点 此 算法 是 有 效 的 。 
这 稳健 化 的 代价 是 有 关 荷载 矢量 w 之 间 正 交 关 系 难 以 保持 .此 算法 是 为 对 苹 和 了 ШЕРА 
点 进行 独立 地 消除 而 设计 的 ,其 中 的 稳健 步骤 是 采用 了 由 Beaton 和 Tukey 提出 的 双 加 权 法 。 
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稳健 诊断 方法 (robust diagnostic methods) 内 为 经 典 的 诊断 方法 大 者 是 基于 一 些 不 稳 
健 的 统计 量 , 如 均值 , 协 方差 等 之 上 ， 故 对 多 个 奇异 点 和 有 强 影 响 点 存在 时 的 诊断 效果 不 好 ， 
于 是 ， 统 计 学 家 就 提出 一 些 新 的 稳健 诊断 方法 ,这些 稳健 诊断 方法 的 特点 就 在 于 它们 大 都 是 
基于 -- 些 稳健 的 统计 量 之 上 ， 故 诊断 效果 均 优 于 经 典 的 诊断 方法 。 

稳健 距离 (robust distance) H f ARS RAN ARM. Rousseeuw 等 提出 了 一 个 稳 
[jun 

RD,-G,—TG)COO  G.—TG0Y 
将 此 式 与 马 氏 距离 MD = Gu 30€ (x, - x)' 进行 比较 , 容易 发 现 , 此 式 与 其 的 主要 差别 在 于 
用 了 (xz) 和 CE 分 别 代 蔚 了 其 中 的 不 稳健 的 均值 矢量 x 和 协 方差 阵 C， 故 有 稳健 距离 之 称 。 

稳健 主 成 分 分 析 (robust principal component analysis, RPCA) 稳健 主 成 分 分 析 是 表 
不 一 类 将 主 成 分 分 析 稳 健 化 的 方法 。 出 于 将 主 成 分 分 析 稳 健 化 可 用 不 同 的 方法 ， 在 化 学 计量 
学 中 形成 了 多 种 稳健 主 成 分 分 析 方 法 ， 

稳健 奇异 值 分 解法 (robust singular value decomposition. RSVD) 基于 投影 她 踪 ， 
Ammann 提出 了 一 种 稳健 奇异 值 分 解法 。 此 方法 由 两 步 先 代 过 程 所 构成 ， D 对 数据 矩阵 进行 
最 小 二 乘 回归 氢 合 , 继而 将 其 向 回归 超 平面 进行 旋转 ; Do 通过 稳健 的 广义 M 佑 计 得 到 协 方 蓉 
ЖЕНИШ LAP AE ХШ. БЕРИШМЕК A EE DU ЖИЛ ЕПИ ЗА, EUR GERI 
分 解法 可 以 成 为 很 多 多 元 分 析 方 法 的 基础 、 如 稳健 多 元 回归 、 稳 健 多 元 判别 分 析 和 主 成 分 分 
析 等 。 

因子 分 析 factor analysis) 因子 分 析 是 化 学 计量 学 中 一 个 应 用 得 十 分 广泛 的 多 元 统计 
方法 ， 其 主要 思路 是 通过 对 数据 夭 阵 进行 让 交 分 解 而 提取 出 主因 子 或 特征 变 曙 来 苦 代 原始 的 
数据 变量 ， 从 而 找到 隐 含 在 数据 中 的 重要 信息 的 一 种 解析 方法 。 它 与 主 成 分 分 析 十 分 类 似 。 

因子 分 析 的 误差 理论 (error theory of factor analysis) 因子 分 析 的 误差 理论 的 主要 思 
路 是 将 分 解 所 得 的 因子 分 成 所 谓 主 轴 和 次 轴 ， 主 轴 包 含 前 d 个 大 特征 值 所 对 应 的 特征 向 量 ; 
而 次 轴 属 于 纯粹 由 景 测 误差 而 引出 的 那 部 分 特征 向 量 ,一 般 说 米 它 们 所 对 应 的 特征 值 都 很 小 。 
出 此 而 将 数据 矩阵 中 的 系统 信息 和 量 测 噪 声 分 开 。 

因子 设计 (factorial design) 因 于 设计 由 著名 统计 学 家 Box 等 提出 , 是 一 种 多 因素 的 全 
而 试验 设计 方法 ， 它 通常 可 由 多 种 因素 的 水 平 数 的 一 个 乘积 表 来 表示 。 如 一 个 三 因 于 二 水 平 
的 因子 设计 可 由 2° 来 表示 ， 亦 即 2X2X2， 需 进行 8 次 试验 ， 而 -- 个 四 办 于 三 水 平 的 因子 设 
计 则 可 由 3 来 表示 ， 亦 即 3X3X3X3, 需 共 进行 81 次 试验 。 因子 设计 钓 任务 就 是 要 通过 这 
样 的 试验 安排 来 了 解 各 个 因素 及 各 因素 水 平 之 间 的 搭配 对 响应 值 或 指标 钓 影响 。 

ВЕ (hidden layer) 隐蔽 层 为 人 工 神经 网 络 的 个 很 重要 的 概念 。 对 于 一 个 具有 多 
于 三 层 的 人 工 神经 网 络 ， 它 表示 存在 子 输出 层 和 输入 层 的 网 络 层 。 办 它们 不 是 人 工 神经 网 络 
的 外 层 ， 故 有 隐蔽 层 之 称 。 

有 偏 估计 方法 (biased estimating method) 有 偏 估计 方法 是 - -类 很 有 用 的 估计 方法 .有 
时 又 称 压缩 估计 。 出 于 共 线 性 的 影响 , 使 得 最 小 二 乘 估计 很 不 稳定 ， 被 估 参 数 具 有 很 大 方 益 ， 
为 减 小 被 估 参 数 的 方差 ,统计 学 家 就 提出 了 一 系列 不 缩 估计 的 方法 , 可 减 小 被 估 参 数 的 力 莽 
但 是 与 此 同时 它们 却 失 去 了 最 小 二 乘 估计 的 无 偏 任 ， 故 有 有 值 估 计 方法 之 称 。 最 常见 的 有 仿 
估计 方 法 包括 岭 回 归 、 主 成 分 回归 种 偏 最 小 二 乘 回 妇 法 。 

约束 背景 双 线 性 分 解 (constrained background bilinearization) 约束 背景 双 线 性 分 解 
法 的 基本 思路 是 利用 样本 量 测 符 阵 Y、 校 正 矩阵 X, G—1. +, n) 和 林 知 干扰 背景 矩阵 的 秩 
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жр, ш. ORG AAE BJ OT UE PC, OR FC MOE 
— BS EMR CT RRS GR F ik. 

子 窗口 因子 分 析 法 (subwindow factor analysis) Р OB FSM — HT SK 
据 的 多 元 分 辨 方法 。 与 渐 近 因子 分 析 法 、 窗 口 风 子 分 析 法 及 正 交 投影 分 辩 法 相 问 都 是 以 分 辨 
纯 组 分 色谱 为 其 日 标 ， 不 同 的 是 子 窗口 因子 分 析 法 是 以 分 辨 纯 组 分 光谱 为 其 目标 。 其 主要 矶 
路 是 利用 在 色谱 方向 上 不 同 子 窗口 含有 一 个 旦 只 伟 有 :个 相同 纯 物质 光谱 的 特性 ， 从 而 将 该 
纯 物 质 光 谱 分 辨 出 来 。 

主轴 (primary axes) 主轴 是 因 于 分 析 误差 理论 中 一 个 重要 概念 .表示 属 子 出 系统 信息 
而 引出 的 那 部 分 特征 向 量 所 组 成 的 因子 轴 ， - 般 阅 来 它们 所 对 应 的 特征 值 都 号 著 大 于 误差 水 
平 ，Malinowski 将 它们 称 为 主轴 。 

HMA MASE (tensor resolution methods) 对 于 里 色 分 析 体 系 的 解析 , 要 获得 唯一 解 ， 
需要 三 维 ， 即 张 量 类 型 的 数据 。 张 量 分 辩 方 法 就 是 这 样 一 类 可 对 张 量 类 型 的 数据 进行 分 辩解 
析 的 化 学 计量 学 方法 。 广 义 秩 消失 因子 分 析 法 、 投 影 旋转 因子 分 析 尖 、 三 线性 交替 分 解法 , ЇЙ 
秩 平行 因子 分 析 法 等 都 属于 张 量 分 辨 方法 。 

张 量 校正 理论 (tensor calibration theory) 张 量 校正 理论 可 看 成 为 构成 分 析 化 学 第 一 
层次 的 基础 理论 的 重要 组 成 部 分 . 简 言 之 . 张 其 校正 理论 就 是 分 析 化 学 中 的 定量 分 析 理 论 , E 
将 常用 的 经 典 分 析 化 学 中 的 灵敏 度 、 选 择 人 性 、 信 噪 比 、 检 测 下 限 以 及 结果 可 靠 性 评价 等 已 为 
广大 分 析 化 学 工作 者 广泛 接受 的 革 本 概念 ， 拓 广 至 矢量 基 至 张 量 数据 ， 将 为 分 析 工 作者 针对 
不 同 分 析 体 系 ， 选 择 正 确定 重 校 正方 法 、 评 价 分 析 结 灯 的 可 靠 性 提供 理论 依据 。 

直接 校正 方法 (direct calibration methods) 直接 校正 方法 是 多 元 校正 中 一 类 用 标准 物 
量 测 谱 直 接 对 混合 物 量 测 谱 进 行 校 正 的 方法 。 根 括 所 采用 的 不 同 数 学 方法 ， 可 分 为 多 元 线性 
回归 方法 (MLR), Kalman 滤波 方法 KF) 和 加 权 最 小 REHA COWLSRO. 

植 入 误差 (imbedded errors) 在 因子 分 析 中 , 量 测 误差 被 分 为 两 项 , MARKEARRE 
CE) 和 和 抽出 误差 (XE》。 其 中 植 人 误差 “TE) 为 存在 于 主因 子 灿 的 误差 , 属于 一 种 用 因子 分 
析 方 法 无 法 史 除 的 一 部 分 误差 。 同时， 它 与 抽出 误差 (XE) MMR AAI (КЕ) 的 
关系 ， 可 由 一 勾 股 定理 的 方式 表 出 ， 即 

(REY — GEY 4- (XE)? 

自 适 应 Kalman 滤波 法 (adaptive Kalman filtering) 自 适 应 Kalman 滤波 法 是 一 种 灰 
色 分 析 的 校正 方法 .一般 的 Kalman 滤波 都 是 用 不 变 的 (8 来 进行 计算 , 而 自 适 应 Kalman i 
波 方法 就 是 通过 在 滤波 过 程 中 调节 r( 如 来 抵制 模型 错误 .从 而 达到 在 有 未 知 十 扰 的 存在 下 估 
计 待 测 物 浓度 的 目的 。 必 须 指 出 的 是 ,对 于 灰色 分 析 体 系 , 自 适应 Kalman 滤波 法 得 到 的 也 只 
是 一 个 可 能 解 ,而 不 是 唯一 解 。 

主 成 分 回归 法 (principal component regression) 主 成 分 回归 法 实际 上 可 以 看 成 是 对 P- 
矩阵 法 的 -- 种 改进 。 它 不 但 可 尽 可 能 多 地 保持 有 用 信息 ， 即 保留 所 有 的 线性 量 测 点 ， 而 且 还 
保持 了 P- 和 矩阵 法 的 既 可 进行 实验 设计 又 可 一 步 求 解 的 优点 。 它 采用 多 元 统计 中 的 主 成 分 分 析 
方法 ， 先 对 混合 物 量 测 矩 阵 了 直接 进行 分 解 ， 然 后 只 取 其 中 的 主 成 分 来 进行 回归 分 析 ， 故 有 
主 成 分 回归 之 称 。 

诊断 方法 (diagnostic methods) 在 统计 学 中 ， 一 般 用 两 种 方法 来 处 理 含 奇异 点 和 非 正 
态 分 布 的 数据 ， 即 诊断 方法 和 稳健 估计 方法 。 这 两 种 方法 哇 处 理 顺 序 完全 相反 ， 但 却 殊 途 同 
归 ， 具 有 相同 目的 。 诊 断 方法 是 善 重 于 首先 找 出 奇异 点 ， 在 剔除 这 些 奇 异 点 后 继 用 经 典 估计 
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方法 处 理 ， 以 达到 最 终 稳健 的 效果 。 

最 小 中 位 平方 法 (least medien of squares) “最 小 中 位 平方 法 是 一 种 具有 高 崩溃 点 的 稳 

fe PUNE. “EWN EL OE 

Min median(r,!) 
在 这 里 median (7.2) Жл ES Н" DEB o b EH HHA BE RT DL PSL 0% ,这 
是 稳健 佑 计 方法 的 可 能 法 到 的 最 高 值 . 然而 , LMS Fh ORR, DES LMS I 
法 的 计算 时 间 与 量 测 样本 的 点 数 (z) 的 立方 成 止 比 、 

最 小 修剪 平方 法 (east trimmed squares) 最 小 修剪 平 方法 是 一 种 稳健 回归 分 析 方 法 
为 克服 LMS 估计 的 较 慢 收敛 速率 之 不 足 、Rousseeuw 提出 了 最 小 方 券 修剪 估计， 其 目标 两 
数 为 

Min S X673... 
在 这 里 Gs G). <<< Gu. 有 从 上 式 可 以 看 出, 此 法 与 最 小 二 乘 奖 似 . 不 同 的 地 
AAR LTS 估计 只 上 起 了 一 -部 分 残 差 较 小 的 来 进行 回归 ( 即 从 00,8, Da, SAH 
的 一 半 时 ，LTS 估计 的 前 省 点 也 可 达到 50% .但 是 它 的 收 化 速度 明 最 加 快 。 

最 小 一 乘法 (least absolute residuals) 最 小 一 隧 法 普 先是 由 Edgeworth 在 1887 年 提 
i. AERAR Mind |, |, 以 减 小 最 小 二 乘 由 于 对 残 差 进行 平方 耐 增 大 异常 点 对 拟 合 的 影 
响 ， 从 而 达到 稳健 的 效果 。 由 于 绝对 值 的 计算 不 便于 微分 . 最 小 一 乘 很 难得 到 像 最 小 二 飞 那 
样 的 简洁 解 古 解 ， 一 般 需 采用 优化 方法 求解 。 

最 小 体积 椭 球 估计 (minimum volume cllipsoid estimates. MVE) ЛЖИ ЖШ 
大 一 种 稳健 诊断 方法 。 它 通过 先 代 过 程 不 断 蓟 除 奇异 点 ， 而 冰 得 -个 最 小 体积 的 椭 球 来 表示 
服从 多 元 正 态 分 布 的 数据 点 的 主体 。 

秩 消 失 因 子 分 析 法 (rank annihilation factor analysis) ” 秩 消 失 因 子 分 析 法 是 针对 二 维 
Dea DESEE IM 该 方法 的 基本 原理 就 是 利用 纯 物 种 二 维 获 光 光谱 是 一 个 双 线 性 
扼 阵 ， 量 其 秩 为 一 的 特点 来 进行 的 。 此 方法 的 基本 思路 为 ， 没 已 测 得 被 分 析 物 的 纯 物 种 二 维 
LIE 将 其 作为 标准 ， 进而 对 含 未 知 干扰 的 混合 体系 的 二 维 荧 光 光 谱 来 进行 消去 该 标准 的 运算 。 
设 林 进行 消去 运算 前 ， 含 未 知 干扰 的 混合 体系 的 量 测 矩 阵 的 秩 为 上 & ， 那 么 ， 当 被 消去 的 标准 
正好 等 于 其 存在 于 混合 体系 的 该 物种 的 浓度 大 小 时 ， 未 知 十 扰 的 混合 体系 的 量 测 年 阵 的 秩 就 
会 减少 1 而 成 为 《一 1)， 据 此 即 可 对 该 被 分 析 物 进行 定量 。 

自 模式 曲线 分 辨 法 self-modeling curve resolution) 自 模式 曲线 分 辨 法 性 一 种 基于 矩 
阵 数据 的 多 元 分 辨 方法 ,主要 基于 主 成 分 分 析 PCA), 其 基本 假设 只 有 两 条 : D 混合 物 量 测 
谱 符 合 线 件 加 合 性 ; ® 波谱 景 测 值 只 能 为 正 值 。 AA RELER RIE Е Вт 
生 的 数据 此 可 成 立 ， 故 其 适用 性 较 广 。 该 法 最 早出 Lawton 和 Sylvestre 提出 ， 他 们 以 混合 物 
体系 的 纯 物 种 光谱 解析 为 目标 ， 以 得 到 它们 的 可 行 解 域 ， 后 被 拓 广 至 二 乌 分 或 三 组 分 以 上 的 
混合 体系 。 随 着 组 分 数目 的 增加 ， 纯 组 分 光谱 的 可 行 解 域 确定 的 困难 显著 增加 ， 

直 现 推导 式 演进 特征 投影 法 (heuristic evolving latent projections, HELP) 直 况 推导 
式 演 进 特征 投影 法 是 采用 ' 一 种 逐步 的 推导 式 方式 来 解析 二 维 色 六 数据 ， 与 自 模式 曲线 分 辨 法 
仅 基 于 全 局 主 成 分 分 析 的 思路 不 同 、 它 主要 基于 局 部 主 成 分 分 析 ， 以 尽量 利用 色谱 的 分 离 特 
性 来 获得 各 子 年 阵 的 有 用 信息 ， 其 中 最 重要 的 是 所 谓 选择 性 信息 ， 在 此 基础 上， 它 试图 根据 
色谱 流出 数据 特性 来 获得 在 色谱 保留 时 间 方 向 上 的 所 谓 “ 秩 图 ". ORR 91 
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Е [d s RIE HSS A Er О Е ЕНЕ d B k BY (ЛЕ ОСЕК ИЕ. Ж 
个 HELP 算法 将 有 以 下 几 个 步骤 来 完成 ， 

O 背景 的 检测 和 扣除 。 利 用 演进 特征 投影 图 对 要 分 辩 的 数据 进行 分 析 ， 如 果 零 组 分 区 的 
光谱 投影 点 没有 集中 于 原点 ， 则 表示 存在 背景 ， 然 后 利用 零 组 分 区 的 信息 来 扣除 背景 ， 

O 数据 预 处 理 与 体系 组 分 数 的 确定 。 对 于 存在 有 不 等 性 方差 噪声 的 数据 、 在 用 特征 结构 
et (ЕТА) 来 确定 体系 的 秩 图 之 前 ， 有 必要 进行 项 处 理 。 另 外 ， 在 决定 体系 的 组 分 数 

时 ， 同 样 有 必要 利用 演进 特征 投影 图 ， 央 此 图 对 各 组 分 的 依次 流出 将 给 出 很 重要 的 信息 ， 以 
SinEE Rm. 

@ 选择 性 信息 和 零 浓度 区 的 确定 , 同时 利用 演进 特征 投影 图 各 特征 结构 跟踪 分 析 所 得 的 
秩 图 来 确定 选择 性 区 域 以 及 该 组 分 的 零 浓 度 区 战 。 

QD 纯 组 分 光谱 和 色谱 和 满 容 分 辨 。 利用 满 秋分 辨 技术 对 己 知 选择 性 信息 和 罕 浓 度 区 域 的 
组 分 进行 分 辨 ， 求 得 其 转换 矢量 以 获得 该 绢 分 的 纯 光 谱 和 纯色 谱 ， 对 于 组 分 数 大 于 3 的 多 组 
分 体系 ， 可 采用 组 分 刊 离 技术 来 逐步 进行 。 

CD 对 分 辩 所 得 结果 进行 证 实 。 将 分 办 所 得 的 各 纯 光 谱 与 纯色 谱 乘积 的 线性 加 合 结果 与 实 
кайни. 以 进一步 确证 所 得 结果 的 可 靠 性 。 

正 交 投影 分 辨 法 (orthogonal projection resolutions ОРК) iE A BOE DRAKA В 
基于 矩阵 数据 的 多 元 分 辨 方 法 , 它 主要 是 基于 Lorber 提出 的 正 交 投影 的 基本 思路 而 提出 . 在 
结构 上 与 Malinowski 提出 的 窗口 因子 分 析 法 (WEFA)》 类 似 . 它 也 是 利用 已 知 的 体系 中 合 
1 个 物种 的 窗口 来 对 第 = 个 物种 进行 正 交 投 影 以 求 得 其 色谱 流出 信息 .只 是 采用 投影 矩阵 的 
方法 来 实现 而 已 。 


第 四 节 ”分析 检 测 理论 与 信号 处 理 


ХА ЕЕН] ЕЖЕ (roughness penalty smoothing method) 粗糙 惩罚 平滑 法 是 一 种 非 参 
数 估计 的 方法 。 其 基本 思路 是 在 最 小 二 乘 估计 的 基础 上 再 加 上 一 个 粗 焊 惩罚 项 来 构成 其 目标 
函数 。 粗 糕 惩罚 平滑 法 一 方面 注意 到 了 拟 合 的 作用 〈 此 点 优 于 简单 平均 )， 另 一 方面 ， 又 注意 
到 了 测量 数据 的 粗糙 性 ， 越 是 粗糙 和 不 光滑 的 测量 数据 中 噪音 的 成 分 就 越 大 ， 受 到 的 息 罚 亦 
BK. 通过 交叉 校 验 (cross-validation) 来 决定 惩罚 程度 , 8] GH Н кш OTHE a RUBRO АЕК 
到 最 好 的 平衡 ， 以 最 大 限度 保证 分 析 信号 既 不 失真 又 能 消除 嗓 声 ， 取 得 最 好 的 平滑 效果 。 

窗口 移动 平均 法 (window movingaverage method) 对 于 一 个 含 噪声 的 波谱 或 电化 学 
谱 , 若 以 对 其 中 第 ; 个 点 及 其 前 后 各 m 个 数据 点 进行 平均 所 得 之 值 来 将 代 第 i 个 点 的 测量 值 ， 
在 此 ，(2m 十 1) 就 是 窗口 的 宽度 。 然 后 依次 移动 此 窗口 ， 直 至 将 整个 波谱 量 测 数 据点 全 用 窗 
口 平均 值 米 蔡 代 ， 这 种 箱 单 的 平滑 法 称 之 为 窗口 移动 平均 法 。 

窗口 移动 多 项 式 最 小 二 乘 氢 合 平滑 法 (Window moving smooth method based on poly- 
nomial least squares) ”窗口 移动 多 项 式 最 小 二 乘 拟 合 平滑 法 由 Savitzky 与 Golay 提出 。 此 
法 不 是 采用 简单 平均 运算 ,而 是 在 答 口 移动 运算 中 引 人 多 项 式 最 小 二 乘 拟 合 。 故 该 法 可 做 到 
既 能 去 噪 提 高 分 析 信号 的 信 品 比 ， 又 可 较 好 地 保持 分 析 信号 (波谱) 中 的 有 用 信息 。 此 法 虽 
ALE 20 世纪 60 年 代 提出 ,但 至 今 仍 在 分 析 化 学 信号 预 处 理 中 频繁 使 用 。 

窗口 移动 中 位 数 平滑 (window moving median smoothing) 由 于 平均 数 的 计算 和 最 小 
二 乘 估计 是 非 稳健 的 non-robust)， 所 以 对 于 一 些 存 在 有 奇异 点 的 波谱 , 窗口 移动 平均 平滑 
法 和 窗口 移动 多 项 式 最 小 二 乘 拟 合 平滑 法 峭 难 于 给 出 满意 的 结果 。 如 果 用 稳健 的 中 位 数 来 代 
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蔡 平 均 数 ， 就 构成 了 窗口 移动 中 位 数 平 消 法 。 

窗口 Fourier 变换 (windowed fourier transform, WFT? Fourier 变 换 将 整个 时 域 信 和 号 
变换 为 频 域 信号 ， 而 失去 了 时 域 中 的 分 辨认 。 为 此 出 现 了 窗口 Fourier ЗА (МЕТ) 或 短 时 
Fourier 变换 (STFT), 它 通 过 对 信号 适当 预 加 答 以 得 到 一 个 局 部 谱 , 它 等 价 于 取出 信号 在 分 
析 点 :一 z 附 近 的 一 个 切片 。 所 以 ,窗口 Fourier 变换 直接 是 信号 ri 在 “分 析 时 间 ” 2 队 近 的 
“局 部 谱 ”。 
中 rank СМА) 表示 在 M 中 除去 N 的 秩 。 此 二 阶 账 晶 校 止 模型 的 选择 性 SEL. = 
Пмаѕ ПТМ | =1， 说 明 此 类 模型 具有 完全 选择 性 ， 故 可 在 末 知 下 扰 存 在 下 直接 对 待 求 物 
种 进行 定量 钙 析 。 

尺度 (scaling) 在 分 析 信 号 的 小 波 变换 处 理 中 ,一 般 实 际 使 用 的 是 离散 小 波 变 换 . 离散 
小 波 变换 定义 式 为 


пъ) R tk) 
Kop. у, RAE. 3 — RES у т G) =r. G—l. tnos EDRR j k F. 其 
离散 小 波 变 凯 也 就 相当 于 


WT, ров) = У), 2 RU. kde, 
= (0277 RO d» 

AP, €t. + KARU ®Й ЖИЙ. HERA I ЖЕБЕ Ha OY 
投影 变换 。 在 此 ,不同 的 ;就 代表 不 同 的 尺度 ORE. 小 波 变换 正 是 通过 不 同 的 ;来 调节 
不 同 的 分 辨 率 的 。 

尺度 函数 (scaling function) — /] E 3E PRA e 3 SU 

hG)— Xa Th Ë) 

HAV, A GONE AG PB Е}ЕЗН Sr fk. RPH A COTES HERR. а, 则 称 为 尺 
度 函 数 系 数 ， 或 尺度 滤波 (scaling fier), REM (scaling vector), 

短 时 Fourier 变换 (short time Fourier transform, STFT) 短 时 Fourier 变换 是 窗口 
Fourier 变换 的 另 一 个 名 称 。 

多 分 辨 分 析 (muiltiresolution analysis) 小 波 变换 的 应 用 都 是 通过 Mallat 提出 的 多 分 辩 
fa SF (МКП) 或 塔 式 算法 来 实现 的 ， 其 算法 在 小 波 变换 中 的 地 位 就 与 快速 Fourier 变换 
(FFT) 在 Fourier 变换 中 的 地 位 一 样 重要 。 

多 分 辨 信号 分 解 (multiresolution signal decomposition, MRSD) 多 分 辩 信 和 号 分 解 
(MRSD) 或 塔 式 算法 是 由 Mallat 提出 的 一 种 著名 的 算法 , 它 可 将 分 析 信 号 矢量 按 不 同 的 分 辨 
率 来 进行 分 解 和 压 缩 ， 在 小 波 分 析 中 占有 十 分 重要 的 地 位 。 

Fourier 变换 (Fourier transformation) Fourier 变换 是 一 种 通过 以 三 角 函 数 为 其 基 函 
数 的 数学 变换 方法 ， 它 可 将 各 种 不 同 分 析 信 和 号 从 时 域 变 履 到 频 域 ， 在 分 析 信 号 处 理 中 ， 它 既 
可 用 于 除 噪 ， 解 卷 积 ， 还 可 用 于 光谱 波谱 分 析 中 的 快速 频 域 变换 ， 是 一 种 十 分 有 效 的 化 学 计 
量 学 变换 方法 。 

光谱 多 重 性 效益 (multiplexing advantage in spectroscopy) 所 谓 光 谱 多 重 性 效益 是 将 
单 通道 光路 通过 一 种 编码 方式 来 增加 光谱 量 测 信 品 比 的 方法 ， 如 用 Hadamard 编码 使 光谱 分 
析 信 噪 比 提高 (N 十 1)/2N'“ 倍 ,在 NN 很 大 时 , 约 为 N12 们 ,这 种 光谱 多 重 性 效益 ,又 称 Fell- 
gett 效益 。 用 Hadamard 变换 设计 的 红外 光谱 与 常规 红外 光 畜 比较 ， 有 改善 信阳 比 的 效果 。 
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Hadamard 变换 (Hadamard transform) 各 元 素 的 绝对 值 均 为 1 RE. RIIA. 
НИНЕН = DH, WEUSEERCS Hadamard Ж. TA H, 如 个 分 析 信号 矢 是 ,经 
变换 后 得 mm 二 Hx, 这 种 变换 称 为 Hadamard 变换 。 在 光谱 分 析 中 ，, 传统 的 扫描 方法 测试 光谱 
每 次 测 一 个 波长 的 光 强 度 , 如 改 为 同时 测定 多 波长 的 光 强 度 , 有 N 个 波长 , 进行 N 次 不 同 的 
组 合 测试 ， 即 进行 Hadamard 变换 ， 则 可 减少 测试 误差 ， 或 改善 光谱 医 测 的 信 品 比 ， 

卷 积 (convolution) 郑 职 是 统计 学 中 的 一 个 概念 、 在 信号 处 理 中 有 痊 十 分 重要 的 意义 。 
与 窗口 移动 平滑 法 类 似 ， 其 离散 表达 式 为 


gira] = UG — r] 


JOEBOE X HME 

ale] = | Усонго — ads 
RP, gG GO RABE SOO) SAGO RU RERBA. ie fO) x AG). BRIA, IA ER 
数 相 对 坐标 折 选 之 意 。 卷 积 运算 实质 上 也 是 一 种 变换 运算 ， 

BRE Fourier 变换 (fast Fourier transform, FFT) 快速 Fourier 变换 (PFT) 的 基本 思 
路 是 将 离散 Fourier 变换 式 进行 分 解 ， 以 减少 运算 ,在 N 是 以 2 为 底 的 客 时 〈 即 N=2", а 
正 整数 )， 这 种 分 解 十 分 方便 ， 如 再 用 二 进 制 来 替代 复数 运算 ， 则 可 使 Fourier 变换 将 乘法 由 
N жаа, 在 此 ,N= 二 2， 亦 即 a 二 lgN， 如 入 一 1024 二 2"， 计 算 量 由 原先 1024" 降 到 


10241x 19， 从 而 大 大 加 速 了 Fourier 变换 速度 ， 故 有 快速 Fourier 变换 之 称 。 


离散 Fourier 变换 (discrete Fourier transform, DFT) 在 Fourier 变换 的 实际 应 用 中 ， 
一 般 用 的 是 离散 Fourier 变换 , 离散 Fourier 变换 就 是 将 连续 的 分 析 信号 x(#) 离 获 化 ， 即 对 分 
BAS z(t) 在 均匀 时 间 间 隔 4 进行 记录 ， 可 得 序列 样本 值 : 
一 了 CNA) п==е,—3,—2,—1,0,1,2,3, + 
RRR N 个 序 贯 样本 值 : 
mari) t=kA k=0.1,2, 一】 
就 可 以 离散 值 之 和 来 近似 表达 连续 Fourier 变换 ， 即 


a wa . 
Xf.) =Í xe ide = AD Xe "Ча = AS Xe eh) m 


= a5 xe zal $) 
这 就 是 所 谓 离散 Fourier 变换 (DFT)， 亦 即 
Xn) = Ste CRI 

PNR (discrete wavelet transformation) 在 分 析 信 号 的 小 波 变换 处 理 中 ，-- 般 
实际 使 用 的 是 离散 小 波 变换 ,将 小 波 变换 定义 式 中 的 小 波 基 函 数 捕 w0 一 (Ca Аа 5/4] 
的 平移 和 伸缩 或 尺度 参数 高 散 化 ， 即 得 

haakt) 2h - k) 

ЯФ. j k AERES. 

如 有 -- 离 散 分 析 信号 xima en), ERR j 上 下， 其 离散 小 波 变换 也 就 相当 于 
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Т.Ю X, "D CREA, 
=r PO Lk» 

Rp, C+, O ARPA, RRA. WAL ЛЕ ЛЕЙ A — Bh ur А Еу 
投影 变换 ， 不同 的 ;, k RA RE (尺度 ) 和 不 同时 域 (平移 )， 这样 的 小 波 变换 就 称 
为 离散 小 波 和 变换 。 

平滑 方法 (smoothing method) 平滑 方法 是 分 析 信号 顶 处 理 中 一 种 常用 的 去 噪 以 提高 
信 噪 比 的 方法 ， 在 分 析 化 学 的 信和 叶 预 处 理 中 得 到 了 相当 广泛 的 应 用 。 在 化 学 计量 学 中 的 平滑 
方法 包括 最 简单 的 窗口 移动 平均 法 ， 窗 口 移动 多 项 式 最 小 二 乘 拟 合法 、 稳 健 中 位 数 法 、 狂 糙 
惩罚 平滑 法 。 

塔 式 算法 (pyramid algorithm) 在 小 波 变换 中 ARAE RS A HE SiR (MRSS 
法 的 别名 ， 其 算法 在 小 波 变换 中 的 地 位 与 快速 Fourier 变换 (FFT) 在 Fourier 变换 中 的 地 位 
一 样 重要 。 

VERH (wavelet function) ЛУ ZEB K f HA AEX A 

WT (a,b) = = als oe 

MA GH. 它 与 窗口 Fourier 变换 很 相似 , 不 同 之 点 只 在 于 小 波 变换 少 了 三 角 函 数 变换 
(e7ir^y 一 项 , 但 增加 了 一 个 伸缩 参数 a, 对 于 大 的 伸缩 参数 <， 基 画 数 变 成 展 宽 的 原 像 小 波 、 
是 一 个 低频 应 数 ; 而 对 于 小 的 a BRR ROR. CA 个 短 的 高 频 函数 。 正 是 这 
一 伸缩 参数 , 使 小 波 具 有 多 分 辨 的 性 质 。 小 波 变换 的 另 - -参数 为 平移 参数 5, 这 就 使 它 也 同样 
AA ADA 12 Fourier 变 摘 可 得 到 时 域 (或 空间 域 )“ 局 部 谱 ” 的 特性 。 另 外 ， 人 小波 变 换 不 像 
Fourier ЖЖ Н Ж = Ж эя ЖЕК АЙ. RMAC ，) 昨 可 收 变 而 且 可 以 相互 正 交 的 。 
KAERRA CORATE EE, 最 著名 和 常用 的 小 波 基 两 数 有 Haar Ж, 
Daubechies Ж. Coiflet 基 和 8B- 样 条 基 等 。 政 是 因为 有 了 这 样 一 些 特点 ,使 小 波 变换 成 为 了 一 
种 比 Fourier 变化 更 灵活 和 更 多 样 化 的 信号 处 理 的 数学 新 工具 。 

小 波多 分 辨 变换 (wavelet multiresolution transformation) 小 波 亚 换 的 最 显著 特性 就 
是 它 的 多 分 状 特 点 。 用 多 分 辩 蛆 数 来 逼近 任 一 晒 数 的 基本 概念 是 由 Meyer 和 Mallat 提出 的 ， 
这 相当 于 我 们 用 显微镜 来 观察 一 个 微生物 ， 如 果 我 们 想 要 该 微生物 的 总 貌 ， 则 需 将 其 调 至 较 
大 视野 〈 低 频 )， 而 不 在 意 该 微生物 各 部 位 的 细节 ;， 反之 如 我 们 想 了 解 基 一 局 部 部 位 ， 则 再 
聚焦 以 高 分 辩 来 观察 细节 。 小 波多 分 辩 分 析 正 是 根据 这 一 基本 思路 来 进行 设计 的 。 在 小 波 变 
Жыр, 有 一 个 伸缩 参数 <， 对 于 大 的 伸缩 参数 =， 基 画 数 变 成 展 宽 的 原 像 小 波 ， 是 一 个 低频 明 
数 ， 而 对 于 小 的 “， 基 函数 则 成 为 缩小 的 小 波 ， 它 是 一 个 短 的 高 频 呆 数 . 正 是 这 一 伸缩 参数 ， 
使 小 波 变换 具有 多 分 辩 的 性 质 . 

第 五 节 化 学 模式 识别 

标准 化 (normalization) ”标准 化 是 一 种 数据 预 处 理 的 方法 , 对 不 局 的 仪器 可 有 不 同 的 方 
法 ， 如 在 色谱 数据 中 常 采用 面积 归 一 化 ， 以 减 小 进 样 误 差 的 影响 ， 而 对 于 质谱 数据 则 常 采 用 
最 大 丰 度 归 一 化 的 方法 。 

Bayes 判别 法 (Bayes discrimination) ”Bayes 判 别 法 建立 在 条 件 慨 举 和 统计 判决 理论 的 
Bayes 定理 之 上 。 其 核心 就 是 找到 一 个 划分 界 或 一 个 判别 界 . 使 得 在 此 划分 界 的 基础 上 计算 样 
本 被 误 判 的 平均 损失 达到 最 小 的 一 种 模式 识别 方法 。 
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范围 标 度 化 (range scaling) 范围 标 度 化 是 模式 识别 中 的 一 个 数据 预 处 理 方法 ， 它 可 由 
TRER: 


Gna Xu aa) 
Gro Fok [5] 


在 此 ，xv 代表 第 ; 个 样本 的 原 有 的 第 j AE TRER i 个 样本 经 换算 后 的 第 7 分 量 ， 
zak 代表 原 有 的 第 7 分 量 的 最 大 值 , zvs+ 则 代表 原 有 的 第 j 分 量 的 最 小 值 。 其 目的 在 于 将 不 
局 测量 方法 所 得 的 变量 值 统一 起 来 ， 都 变 成 到 0—1 范围 之 内 。 

Fisher 判别 法 (Fisher discrimination) Fisher 判 唱法 的 基本 思 路 是 先 计 算出 不 同类 别 
样本 的 组 间 方 差 和 组 内 方差 ,而 后 构造 一 个 组 间 方 差 和 组 内 方差 的 比值 Fisher 判别 法 是 一 个 
可 使 得 组 间 方 差 和 组 内 方差 的 比值 达到 最 大 的 判别 方法 。 

化 学 模式 识别 (chemical pattern recognition) ”化 学 模式 识别 是 化 学 计量 学 研究 中 的 
个 十 分 重要 的 内 容 ， 它 从 化 学 量 测 数据 出 发 ， 进 一 步 揭示 物质 的 隐 含 性 质 ， 为 化 学 家 提供 了 
十 分 有 用 的 决策 性 信息 。 模 式 识别 的 计算 过 程 总 的 说 来 可 有 如 下 步 又: 根据 实验 得 来 的 一 批 
训练 点 , 参照 化 学 (或 物理 ) 模型 或 经 验 规律 提出 一 批 特征 量 ， 然后 进行 进一步 特征 抽取 , 以 
求 得 合适 的 特征 量 ， 张 成 模式 空间 或 特征 空间 ， 必 要 时 ， 对 数据 进行 预 处 理 。 预 处 理 后 ， 即 
可 通过 模式 识别 算法 进行 训练 和 分 类 ， 然 后 根据 训练 〈 或 称 学 习 ) 分 类 所 得 的 判 据 对 未 知 样 
本 进行 判别 (或 称 计算 机 预报 )。 化 学 模式 识别 方法 ， 一 般 可 分 为 所 谓 的 有 监督 的 模式 识 划 方 
法 〈 判 别 分 析 》 和 无 监督 的 模式 识别 方法 RRA). 

句法 模式 识别 技术 (syntactic pattern recognition) 句法 模式 识别 技术 是 一 种 有 别 于 数 
值 模式 识别 的 方法 ， 它 主要 依靠 罗 辑 而 不 是 数值 的 方法 来 进行 模式 识别 。 这 种 方法 还 很 少见 
用 于 来 解决 化 学 问题 。 

距离 判别 法 (distance discrimination method? 虹 离 判别 法 是 一 种 通过 只 离 来 进行 判别 
分 析 的 方法 。 对 给 定 的 一 个 样本 ， 要 判别 它 来 自 哪 个 母体 ， 一 个 最 直观 的 方法 就 是 计算 样本 
到 各 类 С, Go ons Gi WIER dO. Gi), dœ, G), ed, G), 然后 根据 样本 x 到 它们 的 
距离 来 确定 样本 的 归宿 ， 这 就 构成 了 虐 离 判别 的 基本 思路 。 

RAHE (clustering analysis) 桶 类 分 析 法 是 一 种 无 监督 的 模式 识别 方法 . 它 是 多 元 
统计 中 的 -一 种 实用 性 很 强 的 方法 ， 其 主要 思路 就 是 利用 同类 样本 应 彼此 相似 ， 即 常 说 的 “ 物 
以 类 聚 "， 相 类 似 的 样本 在 多 维 空间 中 彼此 的 距离 应 小 些 , 而 不 相似 的 样本 在 多 维 空间 中 彼此 
的 距离 应 大 些 。 聚 类 分 析 即 为 如 何 使 相似 的 样本 “到 ” 在 一 起 ， 从 而 达到 分 类 的 目的 。 一 般 
说 来 ， 聚 类 分 析 方 法 可 分 为 凝聚 法 与 分 离 法 两 类 ， 凝 聚 法 开始 时 将 每 个 样本 认 作 一 个 类 ， 然 
HAE RK: 而 分 割 法 则 与 之 相反 , 开始 时 将 所 有 的 样本 认 作 一 个 大 类 ， 
再 逐步 分 割 为 较 小 的 类 。 

基于 侈 局 寻 优 的 桶 类 法 《clustering methods based on global optimization) ЖЖ 分 析 
实际 上 可 转化 成 为 一 个 优化 问题 但 由 于 于 类 目标 函数 的 严重 非 线性 ， 用 传统 的 局 部 优化 方 
法 难以 找到 全 局 最 优 解 ， 因 此 需 用 全 局 优化 方法 。 若 将 100 个 样本 分 为 2 类， 用 穷 举 法 需 计 
算 高 法 2 一 1 种 划分 ,以 确定 最 优 解 , 且 用 其 他 确定 性 的 全 局 优化 方法 也 因 计算 量 过 大 而 难以 
实现 。 随 机 性 的 全 局 优化 方法 在 处 理 上 述 问 题 上 优 于 确定 性 全 局 优化 方法 ， 遗 传 算 法 和 模拟 
退火 作为 随机 性 的 全 局 优化 方法 已 开始 引 人 化 学 聚 类 分 析 ， 它 们 的 共同 之 处 是 将 时 类 分 析 构 
造成 非 连续 的 组 合 优化 问题 ， 即 通过 寻 投 各 个 样本 对 各 类 的 划分 而 求 得 最 优 目标 函数 ， 此 类 
方法 计算 量 巨大 ， 需 消耗 很 长 时 间 才 能 找到 最 优点 。 也 可 构建 连续 型 优化 模型 ， 即 通过 找 出 


Tn = 
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SAPO RE M STRE T GA BELLE ЙЕ Ж. {ЕНТ BT IR ЗЕН ЕАК AS Б.Ж OR 
解 组 合 优化 问题 ， 减 少 了 计算 量 ， 提 高 了 优化 效率 ， 

кешеж (K-nearest neighbor classification method, К-ММ) 大 -最 近邻 法 是 一 种 
同类 样本 在 模式 空间 相互 较 靠 近 一 一 为 依据 的 分 类 方法 。 它 
计算 在 最 近 信 城中 个 已 知 样本 到 未 知 的 待 判别 样本 的 距离 ， 而 后 决定 该 样本 属于 哪 一 类 的 
非 参数 模式 识别 法 。 对 于 线性 不 可 分 体系 ， 此 法 仍 叮 适用 ， 

K-MMÁÉRXE (K-means clustering method) K- kusam PRAM 82 ЖО 
I. ПМЖ НОЕ А hhi — ЭА k, HERE TSA ED DIRE RE E 
将 别 的 样本 引 人 , 引进 一 个 样本 就 计算 它 与 天 NUM (与 重心 的 距离 ), WEER Eh 
将 其 并 人 该 类 、 再 重新 计算 各 类 的 重心 ， 并 以 该 重心 作为 新 的 凝聚 点 ， 直 至 每 个 样本 都 有 
了 各 自 的 归 类 。 此 方法 在 化 学 计量 学 中 得 到 较 广 泛 地 应 用 。 

可 变 类 平均 法 (variable class average method) 可 变 类 平均 法 是 系统 聚 类 法 的 一 种 方 
法 。 因 在 类 平均 法 的 递 推 公式 中 没有 反映 D, 的 影响 ， 故 有 人 建议 将 它 递 推 公式 改 为 

1? = [n/n ) Р, + (ng/mL 7 D47-8D4] 
ЖР, 8<1. ЧЫ ———— 变 类 平均 法 。 
可 变法 (variable method) 如 将 可 变 类 平均 法 的 递 推 公式 改 为 
D=[0—0D/210O,+ Dy?) 8D 
Xp. #<1. 那么 ， 对 应 于 这 个 递 推 公式 的 系统 聚 类 法 叫做 可 变法 。 

类 平均 法 (class average method) ”类 平均 法 是 系统 聚 类 法 中 的 一 种 。 重 心 虽 是 … 类 点 
集 的 很 好 的 代表 ， 但 未 充分 利用 各 样本 的 信息 ， 有 人 建议 将 两 类 之 间 的 距离 定义 为 这 两 类 元 
素 所 有 样本 两 两 之 间 的 平均 平方 距离 ， 即 

D= Unn) ХУ d 
x€G,x,E€G, 
Eb, 2, An, 分 别 为 类 С, 与 G4 中 的 样本 数 。 此 种 方法 的 递 推 公式 为 
DH — [Gn D, + Onn) D, ] 
有 人 认为 类 平均 法 是 系统 聚 类 法 中 比较 好 的 方法 之 一 。 

BEREK (Mahalanobis distance) 在 统计 学 和 化 学 计量 学 中 ， 马 氏 距 离 是 一 个 常用 的 

诊断 工具 ， 它 的 定义 式 为 


X 


MD,—G,—x)€ (хх) 

ERECEX BEEN EMEN y| x Go 1,2 n) {ИЖЕ „АЯ rika p UT 
的 奇异 点 或 杠杆 点 都 有 一 定 作 用 ， 但 是 ， 由 于 杠杆 点 具有 很 蝇 的 相互 掩 珊 效应 ， 以 致 造 成 很 
多 假象 而 掩 珊 了 真正 的 奇异 点 和 杠杆 点 。 出 现 这 种 现象 的 原由 是 马 氏 距离 是 建立 在 不 稳健 的 
经 典 协 方差 矩阵 之 上 。 

模式 空间 (pattern space) 任何 一 个 化 学 样本 或 化 工 过 程 必 可 用 一 组 参量 (矢量 ) KR 
征 ， 即 多 二 (ra，zz，…，za)， 在 化 学 模式 识别 的 文献 中 ， 这 种 参量 值 又 称 特 征 。 在 许多 情 
况 下 ,这 些 参 量 实际 上 就 是 原始 化 学 量 测 数 据 。 这 样 的 一 组 个 参量 就 构成 了 化 学 模式 识别 
空间 的 一 个 点 ， 一 个 ?= 维 的 化 学 模式 。 由 这 样 的 化 学 模式 所 构成 的 ” 维 空间 ， 称 化 学 模式 空 
间 ， 简 称 模式 空间 。 

模式 空间 的 距离 (distance in pattern space) 化 学 模式 识别 的 基本 假设 是 相似 的 样本 
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在 模式 空间 处 于 相近 的 位 置 ， 如 何 度量 两 个 样本 在 模式 空间 的 远近 ? 可 应 用 存 几 何 学 中 的 距 
离 的 概念 ， 它 在 模式 识别 中 是 作为 与 “相似 性 ”相反 的 “ 相 异 性 ”的 度量 使 用 的 ， 任 何 满 是 
FRET RE “ORE” WA MAMAS BL S ES BE 

(DD;z0; Mx=x,, р,=0 

@ D,=D, 

Ð Dit DazD, 

ЖЮ AE pO E ИН ВЕ Җ FLUE (Ë Ан, ADEA "HEU BBY GEER” Bi 
离 的 差异 ， 在 欧 氏 空间 中 ， 两 点 间 的 直线 距离 恒 小 于 或 等 于 其 他 路 径 的 长 度 。 

模糊 聚 类 法 《fuzzy clustering method) 在 谷类 问题 上 可 采用 硬 分 类 和 模糊 分 类 两 种 方 
法 确定 目标 函数 。 所 谓 硬 分 类 的 结果 是 每 个 样本 将 绝对 地 划 归 某 一 类 ， 即 每 个 样本 仅 能 属于 
一 个 类 :而 模糊 分 类 的 结果 是 每 个 样本 可 在 不 同 程度 上 或 多 或 少 地 属于 各 个 不 同 的 类 . 

判别 分 析 法 (discrimination method) ”判别 分 析 法 是 多 元 统计 中 的 一 种 分 类 方法 、 它 通 
过 已 知 类 别 数据 而 求 出 不 同类 别 的 数据 点 的 判决 而 ， 进 而 可 对 未 知 类 别 数据 点 进行 分 类 ， 是 
一 类 有 监督 的 化 学 模式 识别 法 。 

ДАЛО RHRKBAHS (projection discrimination based on PLS) 为 偏 最 小 二 乘 
方法 实质 上 是 一 种 特征 变量 方法 ， 所以， 如 果 将 样本 点 投影 到 候 最 小 一 乘 方法 求 得 特征 变量 
轴 上 ,就 可 将 高 维 空间 的 点 集 投影 到 低 维 空间 中 来 用 肉 根 观察 高 维 空间 的 点 集 的 数据 结构 ,从 
而 达到 对 它们 进行 分 类 的 效果 。 这 样 的 方法 就 称 为 偏 最 小 二 乘 的 投影 判别 法 ， 它 在 化 学 计量 
学 中 得 到 了 相当 广泛 的 应 用 。 

人 工 神 经 网 络 判别 法 (discrimination bascd on artificial neural networks) 人 工 神 经 网 
络 用 于 化 学 模式 识别 的 基本 思路 与 一 般 的 判别 分 析 方法 是 相同 的 ， 它 也 是 通过 对 已 知 类 别 的 
训练 集 的 拟 合 建立 模型 来 进行 分 类 与 预测 的 。 它 与 非 线性 校正 方法 的 区 别 仅 在 于 校正 方法 的 
拟 合 为 连续 变化 函数 ， 而 化 学 模式 识别 则 是 以 0，1 或 一 1、 十 1 为 其 输出 来 进行 拟 合 建 模 的 。 
由 于 人 工 神经 网 络 具 有 非 线 性 映照 的 能 力 ,近年 来 在 化 学 模式 识 划 中 得 到 了 相当 广泛 的 应 用 。 

识别 率 (recognition ratio) ”识别 率 是 一 种 检测 所 得 判别 模型 的 判别 能 力 的 标准 ， 它 表 
示 在 训练 中 所 得 的 正确 判别 率 。 一 般 说 来 ， 括 测 率 对 模型 好 坏 的 判别 比 识 别 率 更 重要 些 。 

数据 预 处 理 (data preprocessing) ”在 化 学 模式 识别 中 一 般 都 需 对 数据 进行 预 处 理 。 例 
如 ， 各 特征 变量 取 了 不 同 量 纲 的 数值 时 ， 如 果 有 的 变量 到 的 绝对 值 很 大 ， 和 而 另外 一 些 变 量 的 
绝对 值 很 小 ， 则 在 分 类 过 程 中 不 利于 获得 最 佳 结果 。 因 此 上 应 当 用 标 度 化 方法 使 各 变量 的 变化 
幅度 处 于 局 一 水 平 上 ， 它 们 包括 : 范围 标 度 化 、 自 标 度 化、 标准 化 、 变 换 法 和 组 合法 。 对 于 
不 同 的 情况 可 以 采用 不 同 的 预 外 理 方法 ,这 不 但 需要 正确 理解 各 种 预 处 理 方法 的 物理 意义 , 同 
时 也 必须 结合 不 同 问题 的 具体 化 学 经 验 来 对 原始 数据 进行 预 处 理 ， 不 可 统 而 论 之 。 

势 函 数 判 别 法 (potential function discrimination) 势 晒 数 分 类 法 实际 上 是 人 -最 近邻 法 
(K-NN 法 》 的 一 种 很 有 效 的 拓 广 变种 。 它 把 每 一 个 已 知 种 类 样本 的 代表 点 都 看 成 某 种 “ 势 
场 ”的 源 , 例如 一 个 电场 源 即 一 个 点 电荷 。 对 于 未 知 点 属于 哪 一 类 的 判断 基于 这 样 一 个 原则 : 
未 知 点 属于 在 该 点 有 最 大 势 场 强度 的 那 一 类 。 一 般 说 来 ， 势 函数 分 类 法 分 界面 为 复杂 的 不 连 
续 的 曲面 。 

SIMCA 分 类 法 (SIMCA classification) SIMCA 分 类 法 ,又 称 简易 分 类 算法 (simple 
classification algorithm , SIMCA) 或 笨 类 的 独立 软 模式 分 类 法 (Soft Independent modeling of 
class analogy, SIMCA). 它 是 基于 主 成 分 分 析 的 一 类 分 类 法 , 在 化 学 计量 学 中 得 到 相当 广泛 


的 应 用 。 
特征 投影 的 模式 识别 方法 (pattern recognition by latent projections) 通过 特征 投影 的 
AR, 在 尽 可 能 减少 原 d 维 空 间 中 分 类 信息 的 丢失 的 前 提 下 、 将 高 维 模式 空间 的 样本 点 在 二 
维 或 三 维 空间 中 显示 出 来 ， 继 借 人 眼 识别 模式 分 布 情 况 ， 直 接 所 视 分 类 图 景 ， 这 就 是 所 谓 的 
某 于 投影 的 模式 识别 方法 的 主要 思路 。 基 于 投 影 的 模式 识别 六 法 有 很 多 ， 其 中 最 重要 的 有 主 
成 分 分 析 的 投影 判别 法 〔 亦 称 Karhunen-Loeve 变换 ,区 L 分 解法 )、SIMCA 方法 、 基 于 偏 最 
小 二 乘 分 解 的 特征 投影 法 、 非 线性 映照 投影 法 等 ， 因 其 具有 网 形 显示 而 且 有 直观 性 很 容易 
为 化 学 家 所 理解 ， 故 它们 在 化 学 模式 识别 中 得 到 相当 广泛 的 应 用 。 

特征 抽取 方法 (feature extraction) 在 进行 模式 深 别 之 前 进行 特征 抽取 ,选取 合适 的 特 
征 量 ， 以 张 成 合适 的 特征 空间 ， 是 化 学 模式 识别 工作 成 败 的 -个 关键 .特征 量 的 选取 标准 可 
分 为 化 学 (或 物理 ) 的 和 数学 的 两 方面 。 化 学 (或 物理 ) 的 选取 标准 基于 对 所 处 理 的 信息 的 本 质 
或 主要 因子 的 理解 。 这 方面 因 其 依赖 具体 问题 的 实际 情况 ,无 法 指出 普遍 有 有效 的 方法 。 由 于 对 
所 处 理 的 信息 了 解 不 深 ,而 且 往 往 有 许多 因素 之 间 的 相关 关系 及 程度 亦 不 能 肯定 .因此 人 们 通 
党 是 先 根据 化 学 (或 物理 ) 的 选取 标准 尽 可 能 把 一 切 可 能 有 有 关 , 又 易于 获得 的 因素 (特征 量 ) 都 
提出 来 ,然后 借助 于 数学 方法 , 簿 选 出 对 分 类 作用 大 的 特征 量 , 张 成 合适 的 特征 空间 供 分 析 使 
用 ,在 实际 的 计算 中 ,人 们 总 是 力图 抛弃 那些 对 分 类 作用 不 大 的 特征 量 , 使 特征 量 的 数目 (在 保 
证 良好 的 分 类 效果 的 前 提 下 ) 减 到 最 小 。 这 样 的 一 些 方法 就 称 为 特征 抽取 方法 。 

无 监督 的 模式 识别 (unsupervised pattern recognition) 无 监督 的 模式 识别 是 一 种 事先 
没有 已 知 类 别 的 分 类 方法 。 聚 类 分 析 就 是 元 监督 的 模式 识别 法 的 代表 、 其 主要 思路 就 是 利用 
同类 样本 应 彼此 相似 , ШП ЖЛ “8 DIRE. 相 类 似 的 样 木 在 多 维 空间 中 彼此 的 距离 应 小 些 ， 
而 相似 的 样本 在 多 维 空间 中 彼此 的 距离 应 大 些 。 聚 类 分 析 即 为 如 何 使 相似 的 样本 “ 聚 ”在 一 
起 ， 从 而 达到 分 类 的 目的 。 

MARME (hierarchical clustering method) 谱系 聚 类 法 亦 称 系统 聚 类 法 ,是 一 种 很 党 
用 的 凝聚 法 方法 ， 其 基本 思想 是 : 先 将 n 个 样本 各 自 看 成 一 奖 ， 然 后 规定 样本 之 间 的 距离 和 
类 与 类 之 间 的 距离 。 开 始 ， 因 每 个 样本 自 成 一 类 ， 类 与 类 之 间 的 距离 与 样本 之 间 的 距离 是 等 
价 的 ， 选 择 距离 最 小 的 一 对 并 成 一 个 新 类 ， 计 算 新 类 与 其 他 类 的 距离 ， 要 将 距离 最 小 的 两 类 
并 成 一 奖 ， 这 样 每 次 减少 一 类 ， 直 至 所 有 的 样本 都 成 为 一 类 为 止 。 

线性 学 习 机 (linear learning machine) 线性 学 习 机 是 一 种 简单 的 模式 识别 方法 。 线 性 
学 习 机 又 称 线性 判别 函数 法 。 线 性 判别 函数 法 的 目标 是 找到 多 个 矢量 w 来 对 模式 空间 进行 划 
分 ， 如 果 它 们 是 线性 可 分 的 ， 则 总 可 找到 多 个 矢量 w， 使 得 模式 空间 的 不 同类 样本 可 分 。 

一 分 为 二 法 (one divided in two method) 一 分 为 二 法 是 一 种 聚 类 分 析 方法 。 它 的 分 类 
思想 是 分 解法 , 即 是 使 类 由 少 到 多 ,开始 全 体 样本 全 为 一 类 .然后 分 成 两 类 ,三 类 、…… 直 至 所 
有 的 样本 各 自 成 一 类 。 一 分 为 二 法 就 是 这 样 一 种 分 解 方法 。 其 基本 思路 是 将 某 一 类 分 解 成 为 
两 子 类 的 方法 ,然后 对 其 子 类 又 可 一 分 为 二 ,在 不 断 的 分 解 过 程 中 ,使 得 类 间 方 差 保 持 最 大 。 

有 监督 的 模式 识别 (supervised pattern recognition) 有 监督 的 模式 识别 的 分 类 方法 很 
多 , 这 类 方法 的 基本 思路 部 是 用 一 组 已 知 类 别 的 样本 作为 训练 集 , 即 用 已 知 的 样本 进行 训练 ， 
让 计算 机 向 这 些 已 知 样本 “学 习 ?， 这 种 求 取 分 类 器 的 模式 识别 方法 称 为 “有 监督 的 学 习 ” 或 
“有 老师 的 学 习 "。 这 里 训练 集 就 是 老师 ， 并 由 这 个 训练 集 得 到 判别 模型 ， 这 类 方法 一 般 可 分 
为 参数 法 和 非 参 数 法 两 类 ,其 中 参数 法 . MARTE. HANA RE OT IL 
是 否 符合 假设 的 统计 分 布 ， 而 非 参 数 法 多 由 实验 科学 家 或 计算 机 模式 识别 专家 提出 、 对 样本 
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分 布 没有 特殊 要 求 , 几 种 最 常用 的 方法 ,包括 几 种 经 典 的 参数 方法 ,如 距离 判别 分 析 法 、Fisher 
判别 分 析 法 、Beayes 判别 分 析 法 、 逐 步 判别 分 析 法 ， 以 及 几 种 非 参数 方法 ， 如 线性 学 习 机 、K 
邻 域 判别 法 、 势 函数 判别 法 、 人 工 神经 网 络 判 别 法 。 

有 监督 的 学 习 (supervised learning) 有 监督 的 学 习 是 表示 模式 识别 中 的 一 个 学 习 过 
程 。 一 般 是 用 一 组 已 知 类 别 的 样本 作为 训练 集 、 妇 用 已 知 的 样本 进行 训练 ， 让 计算 机 向 这 些 
已 知 样本 “学 习 ”， 这 种 求 取 分 类 器 的 模式 识别 方法 称 为 “有 监督 的 学 习 ” 或 “有 老师 的 学 
习 ?， 这 里 训练 集 就 是 老师 。 并 由 这 个 训练 集 得 到 判别 模型 . 

MAP (prediction ratio) 与 识别 率 一 样 ， 预 测 率 也 是 一 种 用 来 检验 模式 识别 方法 效果 
的 指标 。 为 检测 所 得 判别 模型 的 判别 能 力 ， 常 用 另外 -组 已 知 类 别 的 样本 组 成 测试 集 。 在 训 
练 中 所 得 的 正确 判别 率 称 为 识别 率 , 而 用 测试 集 所 得 的 正确 判别 率 则 称 为 顶 测 率 , 一 般 说 来 、 
预测 率 对 模 耐 好 环 的 判别 比 识别 率 更 重要 些 。 

最 短 距离 法 (minimum distance method) 最短 号 离 法 是 系统 聚 类 分 析 方法 的 一 种 ， 其 
主要 叫 路 是 定义 类 G, 与 G, 之 间 的 距离 为 

站 ,一 minfduw} 
EG , x€G 
AD, А x, tj ox, MR, BUE 52382 AMER 为 两 类 之 同 最 近 的 样本 之 同 的 距离 。 
SKB (maximum distance method) KEAS ERA RAAI A A — н. 
其 主要 思路 是 定义 类 G, 与 G, 之 间 的 距离 为 
Р), = тахійы! 
mEG, , x€G 
RP, d ERER хь 与 х 的 距离 ， 即 类 与 类 之 间 的 距离 为 两 类 之 间 最 远 的 样本 之 间 的 距离 。 

最 小 生成 树 (minmun spanning tree) 最 小 生成 树 是 一 种 基于 图 论 的 聚 类 分 析 方 法 。 在 
图 论 中 , 没有 回路 的 联结 图 叫做 树 。 如 果树 包含 了 个 点 , 则 称 这 个 树 为 联结 图 的 支撑 树 , 树 
的 所 有 边 的 长 度 之 和 叫做 树 的 重量 。 在 联结 图 中 具有 最 轻重 量 的 支撑 树 叫 做 最 小 生成 树 ， 亦 
称 最 小 支撑 树 。 最 小 生成 树 是 按 Kruskal 算法 找 出 的 , 这 个 算法 十 分 简单 , 要 求 将 权 值 最 小 的 
边 绘 人 树 中 ， 但 不 得 与 已 有 的 边 形成 回路 。 其 算法 如 下 : 

CD 先 计算 各 点 同 的 距离 

© 连接 最 小 距离 的 两 点 ， 然 后 连接 次 小 距离 的 两 点 ; 

@ 继续 连接 所 剩 下 点 的 最 小 距离 的 两 点 ,并 检查 是 否 形成 回路 ,如 形成 回路 则 取消 连接 。， 
否则 继续 连接 ， 直 至 所 有 的 点 都 被 连接 ; 

@ 对 连接 所 得 的 树 进行 检查 , 找到 最 大 上 距离 的 边 , 将 其 割断 , 即 得 两 类 , 如 此 继续 分 割 ， 
真 至 类 数 已 达到 所 要 分 的 类 数 。 

自 标 度 化 (autoscaling) ” 自 标 度 化 是 化 学 模式 识别 中 的 数据 预 处 理 的 一 种 方法 , 它 的 定 
QA 


Za Ti MLV, 
式 中 , V, 为 变量 ; 的 方差 ,mm, 为 变量 ;的 均值 。 ART. 经 此 变换 后 , 各 
变量 在 分 类 过 程 中 影响 程度 相同 。 
主 成 分 投影 判别 法 (projection discrimination based on РСА) 主 成 分 分 析 法 实质 上 是 
一 种 特征 变量 方法 ， 所 以 如果 将 样本 点 投影 到 主 成 分 的 特征 变量 辖 上 ， 就 可 将 高 维 空间 的 
点 集 投影 到 低 维 空间 中 来 ; 从 而 可 用 肉眼 观察 高 维 空间 的 点 集 的 数据 结构 ， 从 而 达到 对 它们 
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进行 分 类 的 效果 。 这 样 的 方法 就 称 为 主 成 分 投影 判别 法 ， 它 在 化 学 计量 学 中 得 到 了 相当 广泛 
的 应 用 。SIMCA 分 类 法 就 是 基于 主 成 分 投影 判别 法 而 提出 的 。 

PEREBA (medium distance method) 中 间距 离 法 与 最 短 只 离 法 和 最 长 距离 法 一 样 . 
也 是 一 种 系统 聚 类 法 ， 它 定义 的 类 与 类 之 间 的 距离 既 不 采用 两 类 中 样本 之 间 的 最 短 距离 、 也 
不 采用 两 类 中 样本 之 间 的 最 长 距离 、 而 是 采用 最 近 和 最 远 之 间 的 臣 离 。 

重心 法 (gravity center method) 重心 法 为 系统 聚 类 法 的 -种 方法 . 其 主要 思路 是 用 一 
个 类 的 该 类 样本 的 均值 向 量 ) 来 代表 这 一 类 ， 类 与 类 之 问 的 距离 就 用 重心 之 问 的 距离 
ЖКЖ, HEC, 与 G, 的 重心 分 别 为 H xo G, 5 G, 的 距离 为 

Ds= ds,x, 

这 种 定义 类 与 类 之 间距 离 的 系统 聚 类 法 叫 重心 法 . 

逐步 判别 分 析 法 (stepwise discrimination method) 逐步 判别 分 析 法 是 一 种 有 监督 的 模 
式 识 别 法 ， 其 基本 思路 与 逐步 回归 基本 是 相同 的 ， 每 步 选 一 个 判别 能 力 显著 的 特征 变量 进 
和 人 判别 卫 数 ， 然 后 ， 对 已 选 出 的 特征 变量 逐个 进行 检验 .检验 它们 是 否 对 正确 判别 有 显著 性 
意义 ， 如 其 中 有 某 个 变 辣 由 于 新 变量 的 引信 而 变 为 不 重要 ， 即 对 正确 判别 无 显著 性 意义 ， 则 
将 其 期 除 ， 宜 到 判别 函数 中 所 包含 的 所 有 变量 判别 能 力 都 显著 时 为 止 。 


HRY ”其 他方 面 的 名 词 术语 


一 、 计 算 机 数字 模拟 


RERE (multiplicative congruential method) “和 屁 同 余 法 是 一 种 用 于 产生 在 (0，1) 区 

疗 均 匀 分 布 随机 数 序列 的 递 推算 法 ,其 闪 代 计算 公式 为 
x;— az, (mod m) ,r,=z,/m 

其 中 ,zz, 为 伪 随 机 数 ，; 是 产生 序列 号 ,和 是 一 个 用 作 模 数 的 大 的 整数 ，2 是 个 整 常数 。 通 过 
AE а, m 可 控制 产生 的 伪 随 机 数 系列 的 特性 。 上 式 的 意思 是 ，z 是 a BR m BRR 
Zz,/m 就 是 第 i 个 在 (0, D 区 间 均 匀 分 布 的 随机 数 , 如 此 反复 迭代 , 可 以 产生 一 个 随机 数 系列 
Tis ra a 

刚性 微分 方程 (stiff differential equations) 刚性 方程 是 一 类 很 特 歼 的 微分 方程 ， 它 类 
似 于 线性 方程 组 中 的 病态 体系 。 很 蕉 用 一 般 的 微分 方程 的 数值 解法 来 解 。 目 前 较 有 效 的 方法 
Ж Сеат. 

ЖЕТ (mixed congruential method) 混合 同 余 法 是 一 种 产生 均匀 分 布 随 机 数 系 
列 的 数值 方法 。 它 迭代 计算 公式 为 

=, =a -十 cmod m), rmm 

在 此 , ж, m Wa 的 意义 同 前 , c 为 整 常数 ， 一 般 可 取 奇 数 . 通过 调整 v、“、z 可 控制 产生 
的 伪 随 机 数 系列 的 特性 。 

计算 机 数字 模 报 法 (computer numerical simulation) ”计算 机 数字 模拟 法 是 一 类 利用 计 
算 机 通过 数值 算法 来 模拟 化 学 反应 、 化 学 量 测 过 程 的 研究 方法 。 是 研究 化 学 反应 、 化 学 量 测 
过 程 中 的 误差 规律 和 进行 其 他 化 学 过 程 的 机 理 研究 的 一 个 很 有 效 的 辅助 圣 段 ， 属 化 学 计量 学 
研究 的 一 个 重要 内 容 。 

均匀 分 布 的 伪 随 机 数 Cquasi-random numbers of uniform distribution) 均匀 分 布 的 伪 
随机 数 为 一 种 可 由 计算 机 产生 的 均匀 分 布 的 随机 数 系列 ， 要 求 在 指定 区 间 均 匀 分 布 ， 即 每 个 
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ЖЕРИ ШЖ ЖЕ, Mcr e sm Sc ЕН ЕУ. 并 在 指定 的 长 度 区 间 内 次 序 不 重复 。 最 
常用 的 两 种 产生 均 名 分布 的 伪 随机 数 的 方法 是 乘 同 余 法 和 混合 同 余 法 。 

Monte-Carlo 模拟 (Monte Carlo simulation) Monte-Carlo 模 氢 是 一 种 基于 统计 机 理 
的 数字 模拟 法 。 二 次 世界 大 战 期 间 , 美国 Los Alamos 科学 实验 室 的 研究 人 员 需 要 考察 核 
反应 的 屏蔽 问题 ， 他 们 应 用 滚轮 财 具 试验 构造 理论 模式 . 一 步 步 通 近 了 问题 的 解 。 由 于 
Los Alamos 的 研究 项 日 当时 是 绝密 的 ， 采 册 著 名 赌 城 的 名 字 Monte Carlo 作为 代码 ， 从 
此 ，Monte Carlo 模拟 方法 这 一 名 词 便 成 为 随机 模拟 方法 的 代名词 。 

伪 随 机 数 (quasi-tandom numbers) Monte Carlo 模拟 的 基础 是 对 任意 已 知 分 布 的 数学 
抽样 ， 即 在 计算 机 上 产生 任意 已 知 分 布 的 随机 变量 的 随机 数 。 最 容易 得 到 的 是 O D KA 
均匀 分 布 的 随机 数 *。 从 均匀 分 布 随机 数 ,通过 适当 变换 即 可 得 到 任意 分 布 的 随机 数 。 由 均匀 
分 布 随机 数 可 产生 任意 分 布 的 随机 数 。 然 而 、 在 计算 机 上 产生 的 随机 数 、 是 所 谓 “ 伪 随机 
数 "， 即 用 数值 方法 产生 的 重复 青 现 的 《周期 性 的 》 “随机 ” 数 。 取 同 翌 的 起 始 值 ， 得 到 的 随 
机 数 系列 总 是 全 同 的 。 


二 、 化 学 构 效 关系 


定量 结构 活性 关系 研究 (quantitative structure-activity relationship, QSAR) 定量 结 
构 活 性 关系 研究 是 化 学 计量 学 的 一 个 十 分 重要 的 分 支 ， 它 通过 多 元 回归 或 化 学 模式 识别 的 方 
法 ， 将 化 合 物 的 结构 信息 或 结构 的 量 测 信息 与 化 学 或 生物 活性 联系 起 来 ， 以 找到 它们 之 间 的 
定量 关系 ， 用 以 预测 新 的 有 活性 的 化 合 物 。 它 也 是 药物 化 学 中 的 一 个 十 分 活 牙 分 支 。 

定 最 结构 性 质 关系 研究 (quantitative structure-property relationship, QSPR) 定量 结 
构 性 质 关 系 研 究 与 定量 结构 活性 关系 研究 相 类 似 ， 通过 多 元 回归 或 化 学 模式 识别 的 方法 ， 将 
化 合 物 的 结构 信息 或 结构 的 量 油 信 息 与 化 学 性 质 联系 起 来 以 找到 它们 之 间 的 定量 关系 。 
分 子 拓扑 指数 (molecular topological index) 在 化 学 研究 中 ， 化 合 物 的 结构 多 用 图 来 表 
=, 通常 这 样 的 图 称 为 结构 图 或 分 子 图 。 不 同 的 化 合 物 其 结构 图 也 不 同 。 如 能 将 不 同 的 化 学 
结构 图 数量 化 ， 并 保持 分 子 图 中 的 拓扑 性 质 、 这 样 所 产生 的 指数 统称 为 分 子 拓扑 指数 。 
分 于 连接 性 指数 《molecular connectivity index) 分 子 连接 性 指数 是 对 Randic 分 支 指 
数 如 以 扩展 而 得 。 分 子 连 接 性 指数 有 两 个 基本 假设 : 第 一 、 表示 化 合 物 分 于 结构 和 它们 若干 
性 质 间 的 定量 关系 所 需要 的 “结构 信息 ”包含 在 化 合 物 分 子 的 隐 氧 图 中 第 二 ， КАМАТЕ 
的 性 质 和 隐 氧 图 的 连接 性 指数 问 存在 某 种 函数 关系 。 分 于 连接 性 指数 一 般 可 由 "X. 来 表示 ， 其 
中 ,+t 为 子 图 类 型 ，m 为 图 中 连接 的 边 数 。 

分 子 识别 数 (molecular identification number) 分 子 识别 数 是 一 种 分 子 拓扑 指数 它 实 
际 上 是 分 子 连接 性 指数 和 分 子路 径 数 的 一 种 结合 , 或 更 精确 的 说 ， 是 一 种 加 权 的 分 子路 径 数 ， 
其 中 权 信 就 与 分 子 连接 性 相关 。 

局 部 顶点 不 变数 (local vertex invariants, LOVT's) 局 部 项 点 不 变数 是 分 子 定量 表述 
中 的 一 个 重要 概念 。 包 纳 班 指出 ,用 实数 来 表达 顶点 不 变数 (vertex invariants) 可 看 成 是 第 
三 代 的 分 于 拓扑 指数 ,第 一 代 分 子 拓扑 指数 是 以 对 局 部 顶点 不 变数 的 简单 操作 而 得 的 整数 ;第 
二 代 分 于 拓扑 指数 是 对 那些 由 对 局 部 顶点 不 变数 的 整数 进一步 进行 复杂 操作 而 得 的 实数 第 
三 代 分 子 拓扑 指数 则 应 是 那些 由 第 二 代 分 子 拓扑 指数 进而 得 到 的 实数 。 

立体 效应 常数 (steric effect parameters) ”在 有 机 反应 性 的 相关 分 析 中 ,立体 效应 是 一 
个 很 重要 的 影响 因 于 ， 所 以 ,提出 了 不 少 的 反映 立体 效应 常数 ， 中 较 著名 的 有 Tah 立体 
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数 和 Verloop 的 立体 参数 。 

邻接 矩阵 (adjacency matrix) 化合物 的 结构 多 用 图 来 表示 ， 通 常 这 样 的 图 称 为 结构 图 
或 分 子 图 。 不 同 的 化 合 物 其 结构 图 也 不 同 , 在 1874 年 数学 家 Sylvester 就 指出 , 一 个 化 学 图 可 
用 和 矩阵 表 未 、 这 个 年 阵 叫 拓扑 矩阵 或 邻接 和 矩阵， 此 垂 阵 中 的 元 素 a 定义 为 

а= [? 原子 ; 和 了 没有 键 合 时 

"ol Fim 没有 键 合 时 
这 种 数字 表示 法 可 以 把 化 合 物 的 分 子 经 适当 变换 存 人 计算 机 中 。 上 述 矩 阵 是 对 称 答 阵 ， 和 矩阵 
中 的 每 一 行 或 每 一 列 的 元 素 之 和 即 为 分 子 图 中 相应 编导 的 那个 碳 原子 的 点 价 。 

Randic 分 支 指数 (Randic branching index) Randic 分 支 指数 是 一 种 在 化 学 计量 学 研究 
中 应 用 十 分 广泛 的 分 子 拓扑 指数 。 对 子 分 子 的 不 同 异 构 体 ， 它 们 在 结构 式 中 的 主要 不 同 完全 
是 由 它们 的 分 支 程度 不 同 而 定 , 希望 能 找到 一 个 “ 数 ”, 把 它们 之 间 在 分 支 程 度 不 同 的 区 别 表 
示 出 来 。Randic 指数 正 是 这 样 一 种 简便 的 “分 支 指数 ” 它 可 用 来 表征 分 子 的 分 支 程 度 ， 尾 分 
子 连接 性 指数 的 前 身 。 

退化 性 或 兼并 性 (degeneracy) 退化 性 或 兼并 性 是 分 子 拓扑 指数 人 研究 中 的 一 个 |- 分 重 
要 的 概念 。 分 子 拓扑 指数 的 构建 中 ， 经 党 出现 这 样 一 种 情况 ， 即 不 同 的 分 子 具 有 相同 的 拓扑 
指数 ,未 能 保持 分 子 拓扑 指数 与 化 学 分 子 之 问 的 一 对 应 的 关系 ,这 种 情况 在 ОЗАК 中 被 称 
为 退化 或 兼并 。 在 分 子 拓扑 指数 中 ， 分 子 的 Wiener 数 和 Randic 的 分 支 指数 都 存在 着 退化 或 
兼并 。 

Wiener $6 #) 488% (Wiener topological index) Wiener 最 时 将 拓扑 指数 引入 化 学 ， 故 以 
其 名 命名 。 其 定义 为 : 分 子 中 所 有 不 同 碳 原 子 之 间 的 距离 总 和 即 为 Wiener 拓扑 指数 ， 

W (Wiener $50 = (72, )/2 

ER, WELEH BAF Pare SUR T ZS ŠM. 

有 机 反应 性 相关 分 析 (correlation analysis of organic reactivity) 有 机 反应 性 相关 分 析 
是 定量 构 歼 关系 的 前 身 ， 是 物理 有 机 化 学 家 建立 一 些 物理 和 化 学 的 参数 与 有 机 反应 性 的 相关 
关系 的 一 种 尝试 。 


三 、 人 工 智能 与 化 学 专家 系统 


化 学 专家 系统 (chemical expert system) ”化 学 专家 系统 是 由 化 学 家 采用 大工 智能 的 方 
法 所 构建 的 化 学 计算 机 智能 系统 的 总 称 。 所 涉及 的 领域 知识 当然 是 化 学 的 专门 知识 ， 还 涉及 
建立 数据 库 和 知识 库 、 知 识 表达 及 推理 方式 。 一 般 说 来 ， 一 个 化 学 专家 系统 至 少 要 包括 : 一 
个 综合 数据 库 ， 一 组 产生 式 规则 和 一 个 控制 系统 。 值 得 指出 的 是 ， 当 前 在 化 学 专家 系统 的 研 
究 中 ， 往 往 主张 将 数值 方法 与 基于 知识 推理 的 逻辑 方法 进行 柔性 集成 。 

产生 式 规则 表达 (generating rule expressing) ”产生 式 规则 表达 是 火 工 智 能 用 子 解决 化 
学 课题 常用 的 知识 表达 方法 ,这 种 表达 方法 包含 : O 存储 有 关 问 题 的 状态 和 性 质 的 叙述 性 知 
识 的 综合 数据 库 , 或 称 事实 库 ; © 存储 有 关 状 态 转移 等 规则 的 过 程 性 知识 的 规则 集 或 称 规则 
Ж. @ 用 于 选择 控制 策略 ， 将 规则 与 事实 进行 匹配 、 控 制 利 用 知识 推理 求解 问题 的 控制 器 。 

最 简单 的 产生 式 规则 有 如 下 格式 : 

IF (如 果 ) THEN Ой) 

前 提 结论 

条 件 行动 


33 


产生 式 系统 具有 通用 性 ， 搂 近 人 的 自然 推理 方式 ， 易 为 用 户 理解 。 产 生 式 规则 可 自由 增 
删 、 修 改 ， 便 于 用 户 自行 加 和 领域 知识 ， 但 简单 的 产 牛 式 系统 各 规则 和 独立， 求解 复杂 问题 时 
会 出 现 “组合 爆炸 ”， 因 而 效率 不 高 ,表达 能 力 亦 不 够 强 , 需 进行 扩充 , 使 其 前 提 不 限于 简单 
的 事实 而 是 事实 、 情 况 和 条 件 的 综合 模式 。 

广度 优先 搜索 (breadth-first search) 广度 优先 搜索 为 人 工 智 能 研究 中 的 一 种 搜索 方 
法 。 这 种 搜索 方法 是 从 根 结 点 出 发 ， 依 次 在 每 一 水 平生 成 并 检验 搜索 树 的 各 结 点 ， 在 一 个 水 
平 的 各 结 点 未 检验 完 ， 即 沿 广 度 进 行 的 横向 扫描 未 完成 前 ， 不 开始 生成 与 检验 更 深水 平 的 结 
点 ( 即 暂 不 “扩展 ”)。 这 里 ,认为 同一 水 平 各 结 点 对 问题 的 求解 是 等 价 的 ， 只 是 按 各 结 点 生 
成 的 先后 次 序 ， 先 生成 的 先 检验 ， 沿 “广度 ” 遍 认 所 有 结 点 ， 然 后 才 按 原 次 序 将 先生 成 的 结 
点 先 往 后 扩展 ， 故 称 为 广度 优先 搜索 法 。 

逻辑 表达 (logical expressing) ”逻辑 表达 是 人 工 智能 中 的 一 种 知识 表达 方法 。 MAME 
辑 表达 通常 是 指 一 阶 谓 词 逻辑 (FOPL) 描述 人 工 逢 能 问题 。 谓词 逻辑 表达 较 严 谨 精 确 , 具有 
通用 性 ， 接 近 自 然 语言 ， 但 使 用 效率 低 ， 灵 活性 较 差 ， 常 使 推理 过 程 元 长 。 

逆向 推理 (inverse reasoning) 在 人 工 智 能 的 日 标 搜索 过 程 中 ， 计 算 机 程序 将 自动 产生 
各 种 可 能 的 分 支 和 结 点 ， 然 后 对 这 些 分 支 和 结 点 进行 搜索 。 直 接 从 起 始 状态 向 目标 状态 进行 
推理 的 过 程 称 为 正 向 推理 ， 反 之 ， 如 果 从 目标 状态 出 发 ， 来 寻找 起 始 状态 的 过 程 则 称 为 北向 
推理 。 正 向 推理 亦 称 是 数据 推动 的 ， 逆 向 描 理 又 称 目 标 引 导 的 .在 用 人 工 智 能 辅助 有 机 合成 
路 线 设 计时 ， 就 采用 逆向 推理 。 

启发 式 分 类 (heuristic classification) 启发 式 知识 的 应 用 及 启发 式 搜索 是 专家 系统 不 同 
于 其 他 数值 计算 (包括 模式 识别 ， 的 特征 之 一 。 启 发 式 知 识 是 一 些 不 易 精确 地 用 数学 语言 找 
述 的 知识 ， 化 学 专家 系统 用 到 化 学 家 的 经 验 ， 例 如 谱 图 解析 、 结 构 识别 、 合 成 路 线 设计 等 均 
带 有 假设 的 色彩 。 启 发 式 知识 可 定义 为 ; 有 关 目 前 问题 状况 与 合适 的 解 之 间 的 经 验 性 知识 。 而 
启发 式 分 类 是 将 不 同 分 类 雇 次 上 相互 联系 的 概念 ， 用 不 确定 联想 机 制 结合 起 来 。 启 发 式 分 类 
模型 描述 了 专家 系统 知识 和 描 理 形式 的 特征 ， 表 达 了 经 验 性 知识 的 组 织 和 使 用 。 

BRRR (heuristic search) 人 工 智 能 中 的 育 目 搜索 没有 用 到 所 涉及 问题 的 领域 知 
识 来 指导 搜索 。 对 于 复杂 的 实际 问题 ， 如 化 学 反应 的 设计 常常 无 法 奏效 ， 即 由 于 排列 组 合 太 
多 , 出 现 “ 组 合 爆炸 ”， 如 果 平 均 每 个 结 点 可 有 个 分 支 , 则 搜索 空间 将 随 深度 d 的 增加 按 n 
关系 增加 。 解 决 的 办 法 是 尽 可 能 借助 领域 知识 的 帮助 来 进行 启发 式 搜索 ， 这 是 人 工 智能 提高 
求 问题 解 的 效率 的 基本 诀 穿 。 实 际 上 ， 人 们 在 日 常生 活 中 就 是 这 样 做 的 。 虽 然 这 样 得 到 的 解 
不 一 定 就 是 获得 最 优 解 的 最 佳 途径 ， 但 总 是 在 一 步 步 接近 目标 。 启 发 式 搜索 的 一 种 方法 是 局 
部 择优 搜索 法 ， 即 搜索 过 程 中 根据 领域 知识 ， 在 一 个 局 部 点 各 可 能 路 径 中 选择 最 有 希望 逼近 
目标 结 点 的 方向 ， 例 如 疏 山 选 最 陡 上 升 方 向 仆 ， 即 梯度 函数 最 大 方向 搜索 ， 这 在 只 有 单 峰 极 
值 的 情况 下 能 奏效 , 启发 式 是 不 确定 的 、 基 于 典型 性 假设 的 , 有 时 是 不 易 理解 的 一 种 关系 。 不 
确定 性 是 因为 启发 式 认识 跳 过 了 大 量 因 果 关 系 的 中 间 层 次 ， 而 这 些 中 间 层 次 在 特定 状况 下 可 
能 不 成 立 ， 也 可 能 造成 错误 判断 ， 但 正 是 跳 过 了 中 间 层 次 ， 问 题 的 求解 才 跨 出 了 一 大 步 。 

人 工 智 能 (artificial intelligence) 人 工 知 能 是 一 个 综合 性 的 科技 领域 。Hippe 建议 将 人 
工 智能 定义 为 求知 能 力 的 集合 ， 这 种 能 力 是 指 获取 知识 并 用 于 解决 新 的 未知 的 》 理论 的 和 
/或 实际 问题 能 力 。 人 工 智能 是 指 借助 技术 或 理论 的 手段 ， 应 用 数学 方法 和 /或 数理 膛 辑 研究 
智能 的 各 个 方 而 的 问题 。 简 言 之 ， 人 工 智 能 就 是 研究 如 何 用 人 工 的 方法 与 技术 ， 即 利用 计算 
机 等 工具 ， 模 拟 、 延 伸 和 扩张 人 的 智能 ， 实 现 某 些 机 器 思维 或 脑力 劳动 自动 化 。 人 工 智 能 是 
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计算 机 和 科学 技术 发 展 的 前 沿 领域 ， 化 学 计量 学 很 自然 地 就 成 为 它 的 应 用 领域 之 一 。 

深度 优先 搜索 (depth-first search) ”深度 优先 搜索 为 人 工 智能 研究 中 的 一 种 搜索 方法 。 
此 法 进行 搜索 时 ， 由 当前 检验 的 结 点 作为 父 结 点 牛 成 下 一 级 子 结 点 ， 这 样 由 父 结 点 生成 子 结 
点 的 过 程 继续 下 去 , FERRE OMAN. BE. 表 扩 展 最 晚 生成 的 子 结 点 , 如 
此 下 去 ， 沿 着 最 晚 生成 的 子 结 点 分 支 ， 逐 级 “纵向 ”深入 发 展 . 故此 法 称 为 深度 优先 搜索 法 。 
在 到 达 顶 点 仍 未 找到 有 目标 结 点 时 ， 往 后 “ 回 淹 "， 在 前 一 个 分 支 处 继续 沿 深 度 搜索 。 

搜索 树 (searching tree) ”用 人 工 智 能 解决 -- 个 问题 ， 常 可 说 作 是 在 各 种 不 同 的 可 能 性 
之 间 进 行 选择 ， 或 称 “搜索 ”， 这 个 搜索 空间 可 以 树 分 又 的 形式 表述 ， 常 称 为 搜索 笠 。 

与 /或 图 (AND/OR-graph) 与 /或 图 是 人 工 智能 中 的 一 种 知识 表达 方法 。 与 /或 图 是 -- 
种 超 图 , 通常 以 树 的 形式 . 亦 称 与 /或 树 , 这 种 表达 知识 的 方法 基于 人 们 求解 问题 时 的 两 种 恩 
维 方法 。AND 树 一 - 用 于 分 解 , 将 复杂 的 大 问题 分 解 成 一 组 简单 的 小 问题 , 将 总 问题 分 解 为 
子 间 题 ， 若 所 有 的 子 问题 解决 了 ， 总 问题 亦 告 解决 ， 子 问题 解决 不 了 的 又 可 继续 分 解 : OR 
树 一 用 于 变换 ， 将 较 难 的 问题 变换 为 较 易 的 等 价 的 问题 ， 后 者 如 能 解决 ， 原 有 难题 亦 告 解 
决 。 实 际 求解 问题 可 兼用 二 法 ， 即 AND/OR BERGE. 

详 义 网 络 表达 (semantic net expressing) 语义 网 络 表达 是 人 丁 智能 中 的 一 种 知识 表达 
方法 。 通 过 概念 及 其 语义 关系 用 网 络 图 表达 知识 ， 用 以 描述 样本 、 事 作 、 概 念 等 的 关系 。 语 
义 网 络 起 初 是 为 描述 人 类 记忆 的 心理 学 模型 提出 的 ， 存 自然 语言 研究 中 ， 表 示 复 杂 句 型 的 语 
义 很 方便 。 滞 义 网 络 中 结 点 表示 对 象 、 概 念 或 事件 ， 这 种 去 述 法 在 推理 过 程 涉 及 较 复杂 的 推 
MAA. СЕА. AAMT ORBAN, ALEK MRM RE, IR RER AE 
PUR. RMF RIAA MEM IRE АНА. 

知识 表达 (knowledge expressing) 人工 智能 将 知识 视 为 高 效 智能 系统 的 关键 要 索 ， 知 
识 的 表达 与 管理 就 成 了 人 工 智能 研究 的 中 心 课题 之 一 。 知 识 可 定义 为 具有 智能 的 人 或 机 器 能 
用 以 作出 合理 决策 的 信息 ,知识 表 达 是 指 知识 的 表示 与 描述 , 亦 即 知识 的 形式 化 或 模型 化 - Ш 
识 有 叙述 型 、 过程 型 与 控制 型 等 几 种 类 型 。 叙述 型 知识 叙述 关于 系统 的 状态 ,环境 和 条 件 , 问 
题 的 构想 , 定义 、 事 实 等 ; 过 程 型 知识 表述 有 关系 统 状态 的 变化 、 问 题 求 解 过 程 的 操作 等 控 
制 型 知识 提供 如 何 选择 相应 的 操作 、 运 算 和 行动 的 信息 。 可 用 于 叙述 型 知识 的 表达 方法 有 逮 
辑 表达 法 、 语 义 网 络 表达 法 等 ， 而 能 用 于 表达 过 程 型 知识 同时 义 能 表达 其 他 类 型 知识 的 表达 
方法 ， 最 典型 的 是 产生 式 规则 表达 法 。 


四 、 统 计 学 与 应 用 数学 


半 正 定 (positive semidefinit) 半 正 定 为 线性 代数 中 所 用 术语 , 表示 一 个 矩阵 的 所 有 代 
数 余 子 式 的 行列 式 值 都 大 于 或 等 于 零 ， 如 从 正 交 分 解 即 特征 值 特征 向 量 的 角度 看 ， 则 是 该 矩 
阵 的 特征 值 都 大 子 或 等 于 零 ， 一 般 说 来 ， 在 化 学 计量 学 研究 中 协 方差 阵 都 具有 半 正 定性 质 。 

单位 短 阵 (identity matrix) 单位 矩阵 为 线性 代数 中 常用 的 一 种 特殊 矩阵 ， 即 它 的 对 角 
元 素 都 等 于 1， 而 非 对 角 元 素 都 等 于 0。 任 何 矩 阵 与 它 的 滋 积 都 等 于 原 和 矩阵 。 

对 称 矩阵 (symmetric matrix) ”线性 代数 中 ， 如 果 一 个 矩阵 它 的 转 置 等 于 其 本 身 ， 则 称 
为 对 称 矩 阵 

KREW (euclidean distance) 在 欧 氏 空间 中 , 两 点 x. 和 x, (也 可 认为 是 两 个 矢量 ) 间 
的 直线 距离 被 定义 成 为 欧 氏 距离 ， 可 由 ‖ x, 一 x, d" AE. 在 化 学 模式 识别 中 ， 欧 乓 距离 一 般 
可 用 来 描述 样本 在 模式 空间 的 相似 程度 ,或 度量 两 个 样本 在 模式 空间 的 远近 。 
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FEAR (analysis of variance) 方差 分 析 为 统计 学 中 一 种 常用 方法 。 它 通过 对 数据 的 
方差 进行 分 解 ， 以 得 到 各 部 分 数据 的 方差 。 它 在 采样 理论 、 回 妇 分 析 和 实验 设计 中 得 到 了 十 
分 广泛 的 应 用 。 

方 阵 (square matrix) 方 阵 是 线性 代数 中 的 一 个 概念 ， 表 示 行列 数 相等 的 阜 阵 。 

非 奇 异 矩 阵 (non-singular matrix) 是 线性 代数 中 满 秩 矩阵 的 另 一 种 称谓 . 

J XŠ (generalized inverse) 在 线性 代数 中 , АЖ. 只 有 满 秩 方 阵 才 有 道 . 为 了 讨 
论 一 般 矩 阵 的 道 , 故 提出 了 广义 道 的 概念 .广义 着 有 儿 种 ,在 化 学 计量 学 中 用 得 最 多 的 是 Pen- 
rose-Moore її, GMIN. 

{TAERE (matrix of row full rank) ”为 线性 代数 中 所 用 术语 ， 即 表示 该 矩阵 的 秩 与 
其 行 的 数目 ~ 有 致 ， 也 表示 该 矩阵 的 行 向 量 之 问 都 是 线性 无 关 的 。 

极 大 似 然 估计 (maximum likelihood estimator) 极 大 似 然 估计 为 统计 学 中 的 一 个 常用 
估计 方法 ,最 初 由 Gauss 提出 , 后 由 统计 学 家 Fisher 再 次 提出 极 大 似 然 的 思想 ,使 之 得 到 广 
泛 研 究 和 应 用 。 似 然 估计 方法 的 基本 思路 是 通过 一 族 含 未 知 参 数 的 密度 函数 来 构建 一 个 似 然 
函数 ， 继 求 得 该 量 学 中 也 得 到 了 广泛 的 应 用 。 

和 矩阵 的 迹 (trace of matrix) ”一 个 方 阵 的 对 角 元 素 的 和 称 为 该 矩阵 的 迹 ， 是 线性 代数 中 

一 个 十 分 重要 的 概念 。 由 于 正 交 变换 时 矩阵 的 迹 不 发 生变 化 ， 所 以 它 在 因子 分 析 的 误差 理 
论 中 起 着 十 分 重要 的 作用 。 

和 矩阵 (matrix) 在 分 析 化 学 量 测 中 , 一 个 化 学 样本 一 般 都 可 由 一 个 谱 米 表示 ， ШИ RAS 
光谱 、 色谱 ,各 类 波谱 和 各 种 电化 学 谱 。 如 果 将 很 多 样本 收集 在 一 块 , 就 可 得 到 一 个 矩阵 . 一 
般 说 来 ， 在 这 样 的 数据 矩阵 中 ， 对 一 个 样本 量 测 所 得 到 的 一 个 谱 可 置 为 一 个 行 矢量 ， 这 样 的 
行 矢量 可 称 为 一 个 样本 对 象 或 一 个 样本 ; 与 之 类 似 ， 在 这 样 的 数据 矩阵 中 ， 一 个 变量 《如 一 
个 分 析 通 道 ， 一 个 波长 等 ) 可 置 为 一 个 列 矢量 ， 这 样 的 刚 矢量 可 称 为 一 个 变量 。 大 多 数 化 学 
计量 学 方法 ,都 是 建立 在 这 样 的 化 学 量 测 矩阵 之 上 。 

WMD (reliability analysis) 可 靠 性 分 析 是 统计 学 中 质量 控制 研究 中 的 一 个 重要 
分 支 ， 在 化 学 计量 学 的 研究 中 也 占有 十 分 重要 的 地 位 。 对 化 学 计量 学 方法 的 结果 进行 可 靠 性 
分 析 是 十 分 必要 的 一 个 步 又 。 

办 等 矩阵 (idempotent matrix) 军 等 给 阵 是 线性 代数 中 一 个 重要 概念 。 它 是 指 一 类 自身 
相 乘 还 得 到 自身 的 矩阵 ， 即 AA— A 的 矩阵 。 

Moore-Penrose i (Moore-Penrose inverse) Moore-Penrose X. f “+” 3f, 1009 At. 
对 一 个 nXm BMRB 4， 若 存在 一 个 mXn mem 丈 ， 要 求 满足 以 下 四 个 条 件 ; 

@ AA A=A; @ АТАА = 

@ (АА”)'=АА*; @ (CA*AY—A 
ЖЕТОО H R EHE онан SHAE. 容易 证 明 , Moore-Penrose 道 是 存 
# В — 9. Мооге-Репгоѕе 逆 在 化 学 计量 学 中 应 用 较 广 。 

内 积 Gancr product) 内 积 又 称 点 积 ， 是 矢量 运算 中 的 一 个 十 分 重要 的 运算 规则 ， 所 得 
的 是 一 个 数 。 它 的 数学 定义 为 


ху= Улу, 
它 的 几何 意义 为 两 矢量 间 的 投影 。 如 果 两 个 矢量 的 内 积 为 零 ， 则 说 明 该 两 矢量 垂 
奇异 矩阵 (singular matrix) 奇异 矩阵 是 亏 秩 矩 阵 的 另 一 种 称谓 。 
SPERA AUR (singular value decomposition, SVD) 奇异 值 分 解法 是 计算 数学 中 对 数 


直 。 


Hb 
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据 阵 进行 正 交 分 解 的 一 种 计算 方法 ,任意 实数 矩阵 经 奇异 值 分 解 后 ,一 般 可 得 到 三 个 矩阵 , 即 
一 个 列 正 交 矩阵 ,一 个 对 角 和 矩阵 ,一 个 行 正 交 矩阵 。 其 中 列 正 交 的 矩阵 在 化 学 计 盟 学 中 常 称 为 
得 分 答 阵 , 行 正 交 的 矩阵 在 化 学 计量 学 中 常 称 为 荷载 答 阵 .对 角 和 矩阵 则 收集 了 原 垂 阵 的 特征 
值 .这 一 方法 无 论 在 多 元 校正 与 多 元 分 辩 中 还 是 在 化 学 模式 识别 中 都 得 到 了 十 分 广泛 的 应 用 。 

双 线 性 矩阵 (bilinear matrix)” 双 线性 矩阵 在 化 学 计量 学 中 表示 一 个 矩阵 是 由 两 个 矢量 
的 外 积 而 得 。 这样 的 矩阵 的 秩 为 1。 联 用 色谱 和 二 维 荧 光 光 谱 仪 所 产生 鸭 纯 物质 矩阵 都 是 双 线 
性 和 矩阵。 

特征 值 和 特征 矢量 (eigenvalue and eigenvector) 特征 值 和 特征 矢量 是 线性 代数 中 的 一 
个 十 分 重要 的 概念 ， 在 化 学 计量 学 和 量子 化 学 中 得 到 了 非常 广泛 的 应 用 。 它 们 的 基本 数学 定 
MA: -AEREA MRA 


An =A iot A= 27, 

ЖК bE EY, 15250 k 8 Ee 4 的 相对 十 特征 值 a G= 1.2. JO RR GE 
矢量 。 一 般 说 来 ， 在 化 学 计量 学 中 ,特征 值 所 代表 的 是 数据 隆 的 方 益 ， 特 征 矢 量 是 张 成 数据 
阵 所 代表 的 线性 空间 的 基 向 量 。 

投影 寻 踪 法 (projection pursuit) 投影 寻 踪 是 -种 近年 来 在 统计 学 中 得 到 迅速 发 展 的 
多 元 统计 的 方法 。 如果 一 个 化 学 量 测 的 т 维 数据 可 看 成 是 六 维 室 间 的 一 个 点 , 则 一 组 这 样 的 
de 3E WAR JERE m 维 空 间 的 一 焦点 云 。 降 维 处 理 技 术 的 目的 就 找到 一 种 方法 ， 将 这 些 
高 维 数据 点 在 低 维 空间 中 描述 出 来 而 尽量 做 到 不 改变 这 些 高 维 点 云 的 基本 结构 。 投 影 寻 踪 法 
(PP) 就 是 这 样 一 种 降 维 技术 。 它 首先 定义 一 种 投影 指标 , 然后 , 找到 一 种 最 优 方法 来 实现 这 
种 投影 。 不 同 的 投影 指标 就 定义 了 不 同 的 投影 寻 踪 方法 。 

HER (projection matrix) ”投影 阵 是 线性 代数 中 一 种 十 分 重要 的 和 矩阵， 其 基本 特征 为 
对 称 宕 等 。 在 化 学 计量 学 中 ， 投 影 阵 得 到 了 非常 广泛 的 应 用 ， 很 多 多 元 校正 和 多 元 分 辩 的 化 
学 计量 学 算法 都 是 基于 投影 阵 而 提出 的 。 

样本 对 象 (object) 在 化 学 计量 学 中 ， 人 们 常 把 一 个 化 合 物 的 量 测 谱 《〈 多 元 校正 与 多 天 
分 辨 ) 或 是 描述 一 个 样本 的 一 组 参数 〈 化 学 模式 识别 ) 称 为 一 个 样本 对 象 ， 在 量 测 符 阵 中 它 
通常 为 一 个 行 向 量 。 

中 位 数 (median) 中 位 数 是 统计 学 中 的 一 个 十 分 重要 的 参数 , CSP BRM, 但 是 
平均 值 不 稳健 ， 而 中 位 数 则 是 一 个 十 分 稳健 的 指标 。 

正 交 投影 阵 (orthogonal projection matrix) 正 交 投影 阵 是 线性 代数 中 的 一 种 特殊 算 
阵 ， 它 们 都 是 对 称 香 等 矩阵 ， 其 几何 意义 是 将 某 一 矢量 和 矩阵 向 其 正 交 补 空间 投影 ， 在 化 学 
计量 学 ， 特 别 是 在 多 元 校正 和 多 元 分 辩 中 得 到 了 十 分 广泛 的 应 用 。 

正 态 分 布 (normal distributions) ” 设 连 续 型 随机 变量 + 的 概率 密度 为 

fA/ inse 6 #'%® one poo 

FB. д, 00 为 常数 。 则 称 z 服从 参数 为 w，v 的 正 态 分 布 或 高 斯 分 布 ， 记 为 xz 一 六 (Ap， 
co)。 正 态 分 布 是 一 种 十 分 重要 的 一 种 分 布 ， 一 般 说 来 , 正 态 分 布 表示 由 多 种 不 定 因素 而 产生 
出 来 一 种 分 布 ， 所 以 ， 大 都 假设 化 学 量 测 误差 服从 正 态 分 布 。 用 以 检测 一 系列 变量 是 否 服从 
正 态 分布 的 最 简易 方法 是 采用 正 态 分 布 图 来 对 它们 进行 检验 。 

正定 (positive definite) 正定 是 线性 代数 中 一 个 很 重要 的 概念 , 如 果 说 一 个 矩阵 是 正定 
的 ， 则 说 明 这 个 矩阵 的 特征 值 都 大 于 零 ， 如 果 说 一 个 矩阵 是 半 正 定 的 ， 则 说 明 这 个 矩阵 的 特 
征 值 都 大 于 等 于 零 。 一 般 说 来 ， 协 方差 矩阵 都 是 正定 或 半 正 定 的 。 


第 三 章 ”分 析 采 样 理 论 和 方法 


采样 是 分 析 测 试 工作 的 第 一 步 ， 分 析 测试 结果 的 可 靠 性 与 采样 是 否 正确 直接 相关 。 分 析 
测试 的 目的 就 是 要 根据 从 局 部 试 样 (样本 ) 测 得 的 数据 来 获取 有 关 对 象 全 体 〈 总 体 ) 的 无 偏 
f BL. 怎样 使 局 部 采样 可 在 统计 意义 上 尽 可 能 地 代表 总 体 , 是 采样 理论 和 方法 所 研究 的 内 容 。 
本 章 将 分 别 讨论 分 析 化 学 中 采样 理论 和 方法 。 采样 理论 是 指 如 何 进行 试 样 采集 的 数学 统计 理 
ib. 本章 对 常用 的 采样 方法 亦 分 别 加 以 介绍 ， 如 国体 物质 的 采样 方法 、 动 态 过 程 的 采样 方法 
和 质量 检验 的 采样 方法 。 介绍 理论 将 以 其 基本 思想 为 主线 , 不 作 任何 推导 "; 介绍 基本 方法 则 
以 其 基本 思路 为 主线 ， 指 出 其 使 用 特点 和 适用 范畴 。 

一 般 说 来 , 一 个 成 功 采集 的 分 析 试 样 (或 称 样本 )， 从 统计 上 应 满足 下 述 要 求 : O 样本 均 
值 应 能 提供 总 体 均 值 的 无 仿 估 计 ， 一 般 而 言 ， 随 机 采样 是 保证 这 种 无 偏 性 的 基本 方法 ; © Pe 
本 分 析 结果 应 能 提供 总 体 方差 的 无 偏 估计 ， 例 如 系统 试 样 ， 应 能 提供 分 析 对 象 有 关 参 量 随时 
BERES: © 在 给 定 的 时 间 和 人 力 消 耗 下 ， 采 样 方法 应 给 出 尽 可 能 精密 的 上 述 估计 。 


第 一 节 采样 的 基本 概念 和 理论 


一 、 贿 机 采样 


随机 采样 系 指 等 概率 地 从 总 体 中 采集 的 试 样 ， 采 样 应 在 随机 状态 证 进行 ， 例 如 将 分 析 对 
象 全 体 划分 成 不 同 编号 的 部 分 ， 再 根据 随机 数 表 进行 采样 ， 这 种 采样 法 亦 称 概率 采样 。 在 分 
析 实践 中 ， 要 区 分 目标 总 体 和 母 总 体 两 个 概念 。 目 标 总 体 是 指 欲 根据 采样 与 分 析 作 出 相应 结 
论 的 目标 对 象 ， 而 母 总 体 则 是 实际 被 采集 试 样 的 对 象 ， 这 两 者 很 少 一 致 ， 但 我 们 希望 其 区 别 
尽 可 能 小 。 采 集 随机 试 样 的 方法 即 贿 机 采样 就 是 尽 可 能 缩小 这 一 差别 的 一 种 手段 。 

对 于 随机 采样 ， 如 果 每 a. 样本 被 分 析 了 x 次 ， 则 其 总 方差 a. 为 

s= /ns to / (nn (8-0) 

在 此 ,和民 分 别 表示 采样 和 分 析 方差 。 式 (3-1) 可 用 于 随机 采样 设计 。 假 设 


s= ao 


则 式 (3-1? 可 写成 
ai — oi /nt Ca/n loin) 
从 此 式 可 以 得 出 下 述 结论 : 

@ 对 于 给 定 的 a、n. 和 x。， 总 方差 是 随 着 采样 方差 增加 而 增加 。 

@ 对 于 给 定 的 总 分 析 次 数 mn) 如果 不 考虑 分 析 成 本 ， 则 随机 采样 应 尽 可 能 保证 采样 
次 数 多 为 好 。 如 对 6 个 随机 样本 进行 两 次 分 析 要 比 对 4 个 随机 样本 进行 3 次 分 析 的 总 方差 
要 小。 

@ 随机 采样 的 总 方差 是 2 的 线性 函数 。 当 a 为 一 很 小 数 . 即 分 析 测 定 的 方差 比 采 样 方 差 
小 得 多 时 (在 实际 中 通常 是 这 种 情况 )，(e/m) Col/n)) EE i/a) 来 就 可 以 忽略 。 对 于 这 
样 的 情况 ,Youden 曾 指出 只， 当 分 析 误差 下 跨 到 采样 误差 的 1/3 或 更 低 时 ,宁可 使 用 快速 简 
便 的 、 精 密度 不 高 但 能 与 采样 误差 匹配 的 方法 进行 分 析 。 其 理论 根据 就 在 于 此 。 
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实际 上 , X (3-1) 同样 可 用 于 结合 分 析 成 本 一 起 计算 的 情况 。 设 采样 成 本 和 分 析 一 次 试 
样 的 成 本 分 别 为 Cs TAC. MRE CH 
Cantal, 
考虑 到 式 (3-1)， 总 成 本 可 表示 为 
C= [9/0 to Coin.) ](С.-Еп,С) 
对 此 式 就 п. 进行 微分 并 令 其 等 于 零 B| S p| TE BUE SER T EA HEE ЖЛ 
析 次 数 


п,=(о„/в.)(С,/С„) ? 
和 采样 的 数目 
n= lait Со, /п)]/а: 


二 、 系 统 采 样 


系统 采样 系 指 为 了 检验 某 些 系统 假设 而 采集 的 试 样 , 例 如 生产 或 其 他 过 程 中 成 分 随时 间 、 
温 庶 的 变化 而 在 空间 中 变化 ,这 种 场合 下 的 采样 问题 有 重要 的 实际 意义 实 。 一 般 是 问 隔 一 定 区 
间 《〈 时 间 、 空 间 ， 区 域 ) 采样 ， 间 隔 不 - 定 是 等 距 的 ， 有 时 ， 事 先 可 预期 总 体 成 分 是 不 均匀 
的 ， 系 统 采 样 要 尽量 减少 这 种 不 均匀 性 的 影响 。 对 于 这 样 的 情况 ， 可 采用 分 层 采 样 。 系 统 采 
样 的 误差 分 析 与 随机 采样 是 相似 的 。 


三 、 分 层 采 样 


当 分 析 对 象 可 划分 为 若干 采样 单元 时 ， 随 机 采样 可 从 总 体 的 全 体 采 样 ， 亦 可 分 层 或 分 步 
采样 。 当 被 划分 的 各 采样 单元 之 则 试 样 成 分 的 变化 显著 大 于 每 一 单元 大 部 成 分 变化 的 情况 时 ， 
分 层 采样 是 最 好 的 选择 。 分 层 采 样 是 先 将 分 析 对 象 划 分 成 不 同 的 部 分 或 屋 ， 然 后 对 不 同 的 层 
次 进行 随机 采样 。 此 时 ， 总 方差 为 

ai oi ny в; / Cnn) az! Onana) (8-2) 
RP m -采样 层 数 ; 
s—— E zB i r3 s 
一 一 每 层 的 采样 次 数 ; 
加 一 一 层 内 的 方差 。 

当 分 析 对 象 是 总 体 均匀 分 布 的 话 ， 分 层 采 样 就 与 随机 采样 是 一 样 的 ， 但 如 果 层 间 方 差 与 
层 内 方差 显著 不 同时 ， 分 层 采样 将 明显 优 于 随机 采样 。 值得 指出 的 是 , 由 式 《3-2)》 表 出 的 方 
程 不 可 能 分 别 同 时 唯一 地 求 出 nn 和 xz， 有 必要 在 它们 之 问 进 行 适当 调整 和 妥协 。 如 考虑 
进行 分 层 的 成 本 为 CO. 对 每 层 的 梁 样 成 本 为 C;. 分 析 试 样 的 成 本 为 C,, 则 整个 分 层 采样 过 程 
的 总 成 本 为 

С=С nya, tap, 
当 方 差 固定 时 ,在 使 得 总 成 本 最 小 的 目标 下 , ль, m 和 的 最 优选 择 可 由 式 〈3-3) 的 3 个 式 
Tdi. BI 


m= GIO eC) ?--о,С,! D GOV) (3-32) 
n,—G,/0 (CC) (3-3b) 
n = (0,10) (C/C) (3-30) 


四、 代表 性 采样 


代表 竹 采样 一 般 是 指 特定 的 分 析 项 日 所 涉及 的 采样 ， 例 如 按 环 境 保护 部 门 规定 采集 废水 
试 样 就 是 这 种 例子 。 在 分 析 化 学 的 实际 工作 中 ， 代 表 性 采样 是 一 种 分 层 采 样 的 特殊 情况 ， 这 
种 情况 的 分 层 采 样 可 对 目标 成 分 提供 总 体 均值 的 无 偏 估计 .对 于 在 分 层 采样 中 每 层 的 大 小 和 
方差 均 不 相同 的 情况 下 ,为 了 得 到 总 体 均值 在 方差 最 小 条 件 下 的 无 偏 估计 ,在 第 * 层 的 采样 数 
目 sw， 应 与 该 层 的 大 小 w 和 标准 差 G0, 有 关 ， 即 


najn = Го сао Уно (3-4) 
如 果 在 每 一 层 的 标准 差 都 相等 ， 则 式 (3-4) 可 变 为 
najn = w Sy (3-5) 


式 (3-5) WH, 每 层 的 采样 数 是 与 该 ЖА HN 同时 ,还 说 明 这 样 的 采样 是 与 
随机 采样 不 同 的 。 很 多 的 分 析 技 术 规 则 都 给 出 了 怎样 进行 代表 性 采样 的 规定 。 代 表 性 样本 是 
由 权威 性 组 织 为 某 种 特殊 目的 而 制 成 的 样本 。 一 般 说 米 ， 在 制作 代表 性 样本 的 过 程 中 ， 主 要 
须 考虑 的 就 是 上 述 讨论 的 式 (3-4) RK (3-5) 两 个 式 子 。 PR., 总体 均值 x 的 无 偏 估计 应 该 
是 各 分 层 均 值 的 加 权 均 值 ， 即 


We 


Swan) 

复合 试 样 也 是 制 取代 表 性 试 样 的 一 种 方式 ， 将 一 些 采 集 的 单个 试 样 混合 起 来 作为 复合 试 
样 ， 必 须 考虑 这 样 做 能 否 取 得 正确 的 有 代表 性 的 结果 。 

分 层 采样 的 方 关 分 析 式 (3-2) PMABM ol, оз 和 oi 都 是 未 知 的 , 但 是 , 如 果 对 所 有 
采样 样本 都 进行 了 分 析 以 后 , 通过 方差 分 析 的 方法 就 可 将 它们 都 分 别 求 出 。 设 codes fe Е 
的 第 个 样本 的 第 i 次 的 某 一 目标 化 学 成 分 的 测定 值 ，z, 表 示 第 训 层 的 第 ;个 样本 的 测定 均 
值 ， 对 于 整个 分 层 采样 的 过 程 ， 有 mnn 个 样本 ， 则 o; 的 估计 可 由 下 式 给 出 


(3-6) 


I= 


У, = у — TD nos — 1)] (3-7) 
对 子 第 上 层 , 可 以 得 到 该 ABRE EGO 
V.= эрэ -ах б, — DJ : (3-8) 


在 此 ,3 УВАЖИ, жити 总 体 采 样 方 差 5 的 估计 , 它 还 包含 了 
V, 的 贡献 。 如 设 采 样 误差 与 分 析 测 试 误差 相互 独立 , 则 V, 是 中 十 (cyrs) 佑 计 值 。 对 于 层 间 方 
差 ,可 由 下 式 求 出 
= Ў — #)/ 0 — 1) (3-9) 

Ae BAMA 

同 理 ,这 样 计算 的 层 间 方差 并 不 就 是 由 式 (3-2? 中 的 ot EROS T БН ЖЕ ЛШ ТИПА 
的 方差 的 贡献 ,是 [ci 二 t/n) 十 (62/nsn.)] 的 估计 值 。 但 只 要 利用 式 (3-7) 一 《3-9) 计 算出 了 
У.У. 和 和 V,, 则 不 难 通过 它们 将 ot of A ог 估计 出 来 。 实际 上 ,对 于 所 有 的 man, 样本 的 方差 ， 
有 如 下 的 方差 分 解 式 : 


60 


тл By 
Sah, = novus! + nn, >} (m — 2) 


oe pe 


+n, SNe, -a + УУУ, = хь) 
= КИП 


方差 分 析 本 质 上 就 是 建立 在 此 分 解 式 的 基础 之 上 . de 3-1 列 出 了 分 层 采 样 的 方差 分 析 表 ， 
利用 此 表 可 以 方便 地 进行 分 层 采样 的 各 种 方差 的 估计 。 


R31 分 层 采 样 的 方差 分 析 表 


变化 来 源 平方 和 A h # | 均 为 值 EC E 
9 f | ль? 1 
> 
层 间 sos DD Ge — z): т 1 mnm Vi ab Clm — (af mna) 
= 
Ф # „УУ = а) m. — 1) ГАД ei — Gin) 


ms 


mno. — 1) V. a 


五 、 最 小 采样 数目 的 估计 


前 面 所 谈 到 的 有 关 最 佳 采 样 数目 的 估计 都 是 建立 在 真实 采样 方差 和 真实 分 析 方 差 之 上 
的 。 但 实际 上 采样 乃 是 建立 在 相对 小 样本 采样 之 上 ， 所 以 怎样 利用 小 样本 采样 的 各 种 旋 差 所 
得 的 佑 计 值 来 进行 最 小 采样 数目 的 估计 是 区 讨论 的 问题 。 本 小 节 所 要 讨论 的 最 小 采样 数目 的 
估计 方法 是 建立 在 学 生 分 布 统计 量 或 称 上 统计 最 的 基础 之 上 的 

根据 学 生 分 布 ， 可 通过 计算 所 得 的 均值 z 来 对 真实 均值 x 作出 如 下 的 区 向 千 计 

pcs n (3-10) 

式 中 ,ss 是 总 标准 偏差 m 的 估计 ;学 生 分 布 参数 ! 为 取 一 定 置信 度 和 自由 度 (2 一 1) 时 的 对 应 
值 。 据 此 可 以 算出 ?= 


n= Gr /(z— н) = Gs? /es (3-11) 
因为 一 待 求 数 ,所 以 在 对 参数 + ERREN IGF n= co 作 为 其 自由 度 来 确定 + 值 ,用 此 
z 值 根据 (3-11) 式 算出 一 个 4 后 , 继 用 此 来 再 查 得 一 个 新 的 : 值 ,如 此 循环 ,直到 收 化 于 一 
常数 。 对 于 随机 采样 的 情况 ,总 的 分 析 测试 数目 为 mx。, 如 果 分 析 测试 的 标准 偏差 * 很 小 可 以 
忽略 时 , 则 分 析 测试 的 误差 也 可 以 忽略 ,因此 可 以 将 (3-11) 式 简写 为 
m= Qs) let (3-12) 
式 (3-12) 是 由 小 样本 采样 导出 的 。 对 于 大 量 样本 采样 的 情况 , 即 采样 量 占 总 体 量具 有 相当 
部 分 时 , 需 引信 一 个 称 为 有 限 总 体 校正 ”因子 , 即 (1 一 a/N)2?, 来 进行 校正 在 此 ,N 是 总 体 所 
售 样 本数。 将 此 校正 因子 乘 人 式 (3-10) 右 边 的 第 二 项 ,得 
n,— (s N) / (е N +£ st) (3-13) 
从 式 (3-13) 明 显 可 知 , 有 限 总 体 校正 因子 只 对 小 总 体 的 情况 是 适用 的 ,如 果 总 体 很 大 ,也 
即 入 很 大 , 则 该 校正 因 于 就 变 为 1 了。 
引入 上 -统计 量 和 置信 度 的 概念 ,就 使 得 对 采样 数目 的 估计 变 得 实用 了 。 这 样 ,在 前 面 所 讨 
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论 一 些 式 子 的 未 知 真 实 量 如 o SERI AHH BRAT ms СЗЯ TBA 
ef = (si) /nst Esi) / Gan) (3-14) 
ROA ЖЖ EH OBE. A RR V LR EE KE л, 
m =[# (si+si/n,) ]/ei (3-15) 


六 、 采样 常 数 


(一 ) Ingamell 采样 常数 

为 表征 混合 得 很 好 的 实验 室 样本 的 均匀 性 ，Ingamell 定义 了 一 个 采样 常数 К, 

К,= Кт (3-16) 
式 中 ，R 为 相对 标准 偏差 ， 即 R—100Xs,/z, m PRAM, WEA (3-16) 与 式 
(3-12) 比较 一 下 可 发 现 , zü (3-16) 中 隐 含 如 下 意义 : Ingamell 采样 常数 天. 相当 于 保证 采样 
相对 标准 偏差 为 1% 时 的 必需 样本 质量 ,， 此 时 ,tt- 统 计量 的 取 值 为 1， 即 自 电 度 为 无 穷 大 和 置 
FEW 68710300210, WF le 样本 , Ingamell 采样 常数 就 是 经 一 个 很 精确 的 分 析 方 法 (A 
此 时 分 析 测 定 的 误差 相 对 于 采样 误差 可 以 忽略 》 测定 所 得 的 相对 标准 偏差 的 平方 根 ， 一 般 就 
可 用 此 方法 来 实验 确定 Ingamell 采样 常数 。 如 果 将 式 (3-16) 改写 ， 可 得 
R’=K,/m (3-17) 

AK, 5—ЖЖ.ВТ RRMA RARER RS RRR RAM 
相对 偏差 就 必须 保证 采样 需 有 相应 的 足够 质量 。 同 时 ,从 式 (3-17) 还 可 以 看 出 ,KK, 愈 小 ,说 明 
样本 的 混合 程 鹿 傅 好。 对 子 分 层 测定 的 非 均 匀 样 本 ,其 不 同 的 层次 当 有 不 同 的 Ingamell 采样 
常数 ,人 们 也 常用 此 法 来 测定 总 体 的 均匀 程度 。 对 了 分 隔 的 总 体 ,应 引 八 附加 的 分 隅 常数 。 

(Z) Visman 采样 常数 

Visman 阐述 了 在 考虑 分 隔 效 应 下 的 采样 理论 ""。 实 验 估计 方差 与 两 个 采样 常数 有 关 , 一 个 是 
55 Ingamell 采样 常数 相似 的 均匀 度 常 数 4， 另 一 个 是 反映 分 隔 (segregation》 程 度 的 常数 B. 

si=A/(mn) H- B/n, (3-18) 
AP, mn, 是 个 样本 的 总 质量 。 如果 总 体 样本 是 均匀 的 ， 则 В=0. 此 时 式 〈3-18) RIR 
(3-16) 完全 类 似 ， 并 可 容易 发 现 Ingamell 采样 常数 与 Visman 采样 常数 存在 如 下 关系 : 
A=10 xz X K. 

Visman 采样 常数 可 通过 收集 一 系列 小 样本 和 一 系列 大 样本 来 进行 实验 确定 。 先 对 这 两 
系列 的 方差 进行 估计 。 然 后 , 将 这 两 系列 样本 的 质量 和 所 得 的 方差 代入 式 〈3-18)， 就 可 估计 
出 Visman RYE А ЯП В Ж. ME, AR (3-18) 还 可 以 看 出 , 假设 希望 保持 方差 不 变 , Ж 
EREA Visman 的 表征 分 隔 效 应 的 常数 B 增加 而 增加 的 ， 而且， 采样 方差 与 采样 数 成 反 
比 , 增加 采样 数 可 降低 采样 方差 。 当 B=0 时 ， 说明 样 本 总 体 是 均匀 的 ， 此 时 ， 只 要 样本 的 总 
质量 Onn KE, 采样 数 将 不 再 影响 采样 方差 。 


第 二 节 ” 非 均匀 体系 建 模 方法 与 大 批 物质 的 采样 误差 


一 、 园 体 物质 的 采样 理论 和 方法 


Benedetti-Pichler 将 大 批 固 体 物 质 的 采样 问题 与 在 一 个 装 有 成 百 吨 混合 的 白 豆 和 红豆 大 
仓库 中 对 它们 进行 计数 的 问题 作 了 一 个 类 比 。 如 采 要 对 仓库 中 所 有 的 豆子 都 一 一 计数 ， 则 需 
花 极 长 的 时 间 ， 人 们 只 好 转向 一 个 比较 现实 但 不 予 全 部 计数 精确 的 方法 。 首先 ， 从 中 取出 一 
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MEAL ujar AIL ӨЕ, BORA m SR SRA DR AEE 
B, ЖЖ ЕЗИ АМО НЕ ЭЕ, RGD. RAMA. uin 36000 RR 
定 采样 量 。 对 于 大 批 园 体 物 质 总 体 的 现代 采样 理论 - - 般 说 米 部 是 基于 这 一 道 埋 。 

设 分 析 对 象 总 体 是 由 两 类 立方 体 颗 粒 A 和 了 所 组 成 . 这 些 颗粒 具有 同样 的 楼 长 x 和 同样 
的 密度 po， 颗粒 A 的 总 质量 百分比 为 wa( %)， 而 颗粒 BB 的 总 质量 百分比 为 rwwa( 光 )。 先 状 虑 
- -个 最 简单 模型 ， 即 只 设 颗 粒 A 中 含有 待 测 物 z НОУ ERR A 的 质量 百分比 为 *e,。 
如 取 具 有 质量 为 m 的 样本 进行 化 学 分 析 , 其 采样 方差 为 忆 、 这 样 的 模型 可 用 二 项 式 分 布 来 处 
理 。 对 于 服从 二 项 式 分 布 的 随机 变量 , 其 方差 为 ape。 根据 上 述 讨论 的 简单 模型 . 采样 颗粒 数 
Gn) BER m/o, 其 取得 颗粒 A 的 概率 Co) RR CHO ,其 取得 颗粒 BR 的 概率 (q) DS es (22) 
或 (1 一 wA)， 据 此 ， 可 得 根据 颗粒 数 来 表述 的 采样 方差 o: 

lesse = [ma X wa X (100—193) ]/T Ср) X 1000] (3-19) 
如 以 所 求 物质 的 百分比 来 计算 ouo › DU ISZ FER СС О H BE 
6, = [буена Ge! pp] X 100 
最 简单 的 情况 是 颗粒 A BRE BER P 2600 BENA wen и, BA 
в,= (o) fm) X u, X (100— o.) (3-20) 

式 (3-20) 可 用 于 估计 给 定 样本 质量 时 的 采样 误差 , 或 用 来 在 给 定 了 采 习 误差 标准 的 条 件 
下 来 估计 所 需 最 小 采样 量 。 当 然 ， 此 模型 过 于 简单 ， 在 实际 的 分 析 化 学 实践 中 ， 一般 须 对 此 
模型 进行 必要 的 修订 。 

上 述 统计 原理 ， 可 推广 到 较 接近 实际 的 情况 ， 即 没 试 样 总 体 中 含 两 种 颗粒 A 和 也， 颗粒 
АЗА ОШИО чо, ШВ 仿 待 测 物 的 百分比 (质量 分 数 ) esc H. 
颗粒 A 的 密度 为 pa, BURL B 的 密度 为 pa», 这样， 上述 简单 模型 可 变故 

oi — [Солрв/р) X ёт) Xw X (000—240 ] X [ Cw, —"e,2*/1001 (3-21) 

式 (3-20) 中 ,不 但 考虑 了 试 样 总 体 的 密度 о, H EF BOR A 和 颗粒 了 的 不 同 密度 也 一 
起 进行 了 考虑 ,同时 此 式 中 的 最 右边 的 平方 项 , 即 LCsres 一 "ez)2/1000] 这 将 两 老 颗 粒 的 不 同 百 
分 含量 也 进行 了 考虑 。 从 式 (3-21) 可 明显 着 出 ,^w, Mo, 的 差别 越 大 ,其 采样 误差 也 
越 大 。 

存 分 析 化 学 文献 中 ,对 上 述 模 型 有 很 多 不 同 的 表达 式 . 然 而 它们 之 间 的 差别 只 在 于 
些微 小 的 统计 近似 和 假设 的 不 同 ,本 质 上 是 类 似 的 ,下 面 将 它们 列 出 ,以 备 读者 参考 。 

(D Benedetti-Pichler 经 典 方程 

а= (papal P X [p(0 р) /n] 2 X Ce, Pw) ae, (3-22) 
UP yw, XE PERI ALA) IO EAE TE Se ОК E AO p 为 取得 颗粒 A 的 概率 。 
© Ingamell 方程 


(zo, pa “ao pa) Co, =w) Go, Mer) ee 


Ew , 
Ko Rw =e (ar m,y Cw, m.) + Paw, Pw.) Cw, ^w D ]X 10 5 /2z (3-23) 
® Wilson 方程 
"m 
= 233 — Awe) 1000 X Gum, fo,p,) X (p/m) (3-24) 


= = 


Wilson 方程 是 将 二 元 颗粒 的 非 均匀 体系 推广 到 多 元 颗粒 的 非 均匀 体系 的 表达 式 。 式 中 下 
标 i 和 j 表 示 在 种 颗粒 的 第 i 或 第 ;种 颗粒 , Ace, 表示 zw 与 总 体 含量 zo, 之 间 的 差 值 。 同 时 ， 
Wilson 方程 是 建立 在 所 有 颗粒 都 具有 相同 体积 的 基础 上 ， 如 果 颗 粒 的 密度 具有 较 大 的 不 同 ， 
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Wilson 方程 只 在 s ЖАКАУ. 
二 、 颗 粒 性 质 因子 (Gy e) 


基于 研究 粒状 物质 的 采样 ，Gy 对 非 均匀 体系 的 采样 发 展 了 … 套 轻 全 面 的 理论 。 根 据 Gy 
的 采样 理论 ， 由 式 (3-200 表 出 的 简单 公式 可 改写 成 


m lig ñ 
a= (ри) xw, X (100m)! зр gg] Fad (3-25) 


在 式 (3-25) 中 , 原 式 中 的 (1/m) 由 | Lg КЖ Г. ate T EO T И ИПИЕ 


量 对 采样 方差 的 影响 ,采样 误差 是 随 着 采样 质量 m 的 增加 和 总 体质 量 的 减少 而 减少 的 , 当 采 
样 质量 m 增加 到 接近 于 总 体质 量 M 时 ,采样 方差 就 会 接近 于 零 : 当 总 体质 量 M 比 采样 质量 
大 很 多 时 ， 士 一直 | 就 很 接近 (1/m) ,总 体质 量 的 影响 可 忽略 不 计 了 - 

1 颗粒 形态 因子 (了 ) 

在 式 (3-20) 的 导出 过 程 中 ,所 有 颗粒 都 是 假设 为 具有 立方 体形 体积 (0), п] ЗЕ ҖЕН 
形态 是 有 差别 的 。 式 (3-25) 中 引信 的 因 于 就 为 了 补偿 这 些 差别 的 。 如 果 是 在 理想 的 情况 下 。 
颗粒 形态 因子 f 可 以 取 1; 如 果 所 有 颗粒 都 是 以 4 为 直径 的 小 圆 球 组 成 时 , 则 颗粒 形态 因子 / 
可 取 0. 524, 对 于 大 部 分 总 体 样本 ,可 取 О. 5, 相 对 于 / 取 1 ,这 尾 一 种 对 实际 情况 的 较 好 的 明 
近 。 如 果 总 体 物质 是 具有 特殊 形态 的 颗粒 ,如 黄金 颗粒 ,里 粒 形 厦 因 子 f 可 以 低 至 0. 2。 

2. 颗粒 大 小 分 布 因 于 Cg) 

在 式 (3-20) 的 导出 过 程 中 ,所 有 颗粒 都 是 假设 为 具有 相同 大 小 的 ,可 实际 上 里 粒 的 大 小 也 
是 有 差别 的 , 故 在 式 (3-25) 中 引信 颗粒 大 小 分 布 z 因子 米 补 偿 这 种 差别 。 在 理想 的 情况 下 , 颗 
粒 大 小 分 布 因 于 z 取 1; 如 果 频 粒 大 小 差别 较 大 , 即 既 有 很 粗 的 又 有 很 纲 的 混在 一 起 时 , 则 颗 
粒 大 小 分 布 因子 g 推荐 取 0. 25. 对 于 只 有 中 等 蜂 镁 或 是 只 有 小 颗粒 时 , 则 颗粒 大 小 分 布 因子 8 
可 分 别 取 0.5 或 0.75 为 好 。 

3. 释放 (Liberation ?因子 (2) 

在 式 (3-20) 的 导出 过 程 中 ,假设 总 体 物质 由 两 种 颗粒 A 和 B 所 组 成 , 耐 且 ,还 假设 了 
semua 可 是 ,在 实际 情况 下 ,有 可 能 一 些 板块 可 能 同时 含有 两 种 颖 粒 。 在 研磨 过 程 中 ,那些 
含有 待 测 物 的 颗粒 从 板块 中 被 释放 出 来 。 如 将 这 种 释放 过 程 也 加 以 考虑 ,就 可 引 人 释 故 因子 
LAUS 


{= Ga / 1)? (3-26) 
ДЕҢ, a 是 板块 中 含有 待 测 物 的 细 粒 的 平均 尺寸 ,而 z, 则 是 总 体 物质 中 的 最 大 板块 颗粒 的 尺 
寸 。 当 nemus BEI 1. BU EUR RAAE. BAAT: ВОЛАН КЕ HR E 3k OR 
BOE. 
4. 组 成 因子 (c) 


ере 和 /外 ,还 可 以 定义 一 个 组 成 因子 。 这 个 因子 主要 反映 颗粒 组 成 变化 对 


采样 方差 的 贡献 。 考 虑 到 总 体 物 质 的 密度 (e) 实 际 应 为 两 种 不 同 颖 粒 密度 (oa 和 ов) КШ 
均 , 即 


E 100-2 
Pi004 二 107 


А (3-27) 
则 组 成 因子 c 可 定义 为 
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100-2, 
100 | 


(ж 
c=z(100—z) 1109 


此 时 ,Gy 的 采样 理论 可 由 一 个 很 简单 的 式 子 表示 


а=е| 1 d efgl (3-28) 


三 、 动 态 过 程 中 物质 流 的 采样 理论 和 方法 


若 采 样 对 象 是 一 个 连续 过 程 ， 需 从 过 程 中 的 物质 流 中 采样 ， 则 情况 较为 复杂 ， 从 数学 上 
讲 这 种 过 程 可 以 时 间 序 列表 示 。 在 这 个 序列 中 ,可 在 图 3-1 REE p 作为 一 个 “批量 ”、 按 
频率 4 在 时 间 G 内 采样 4 次, 采样 理论 需 考 察 G、4、n 对 估计 的 成 分 的 影响 "对 于 一 
Bt Gauss ASMIR, $ 一 24， 设 4>G， 即 采样 不 重奏 ， 则 采集 的 总 样 S=nC。 这 里 ， 
采样 的 总 样 成 分 变化 的 方差 把 ， 与 作为 批 的 整个 段 的 成 分 变化 方差 оу MOR PED ЭЎ ot 的 页 
献 可 表述 为 

0105 F0; T 2om, (329) 

AR, сб SHOA WDA. 

Muskens 3019 -四 从 一 阶 Gauss 稳 态 随机 过 程 理论 推导 了 式 〈3-29) 右边 的 各 项 。 设 过 程 
的 相关 因子 为 了 P/T: p, G/T, Эрк. A/T. 为 a。， MEAZA ot, MH 

a= (20: /ng) gitet (е 十 ez 一 2)[e 7/0 7e72]— [e "7e 2) 1/ 


Diü-e7] (3-302) 
a= (2oilp')(p—lte ^) (3-30b) 
Ga = (npg) ngt (—e [C757 0/0 —e 7) +e *7—D/O-e70]) (3-30c) 


图 3-1 从 动态 过 程 物质 流 采 样 示意 图 


这 里 ,作为 批 的 参量 起 作用 的 是 p OA T. 单位 表征 p)。 批 的 概念 在 这 里 并 不 限于 一 个 均 
相 的 物质 流 , 例如 管道 中 液体 物质 对 应 于 p 的 量 可 以 是 时 间 、 KE, 质量 等 任何 单位 表示 ,以 
时 间 表 示 时 ， ЖЕН + Т, 称 为 时 间 常 数 。 亦 可 使 用 无 因 次 ， 或 以 物质 的 包 数 等 表示 。 在 上 述 
LEP, 总 样 的 参量 包括 G 的 大 小 及 两 次 采样 之 间 的 距离 4， 如 果 选 择 C 很 大 ， 以 致 采样 之 
间 实 际 无 间隔 ， 显 然 此 时 0， 这 时 整个 “ 批 ” 均 被 采集 , А=р/л, BRM ADE nG— p. 
随时 间 常 数 增 大 ， 即 Too, 体系 趋 近 于 一 均匀 的 对 象 , B da Gar оъ, ВЕ РА, 10— 
份 任意 大 小 的 样 即 能 代表 总 体 "1。 


第 三 节 质量 检验 的 采样 方法 


质量 检验 分 析 中 ， 需 根据 分 析 结果 决定 产品 是 否 合格 ， 一 般 分 为 计生 抽样 检验 与 计数 抽 
样 检验 两 种 采样 检验 方法 ""。 


一 、 计 量 抽样 检验 


这 种 检验 方法 是 定量 测试 产品 中 某 一 变量 。 分 析 检 验 中 常见 的 情况 是 测定 某 一 组 分 的 百 
分 含量 ， 例 如 某 种 有 效 成 分 的 最 低 含量 ， 某 种 有 害 成 分 的 最 高 含量 等 。 在 考虑 这 种 检验 的 采 
样 时 ,首先 需 确定 合格 产品 的 相应 定量 标准 。 今 很 设 待 测 的 组 分 食量 这 一 变量 服从 正 态 分 布 ， 
并 设 产 品 中 的 有 效 成 分 x 的 最 低 含量 标准 为 zx! 分 析 方法 的 标准 差 为 0, 可 计算 对 应 与 任意 真 
实 含量 的 > 的 x 值 ， 即 标准 正 态 分 布 值 : 

и=(т,—х)/а (3-31) 

从 标准 正 态 分 布 可 计算 实际 含量 为 时 该 批 试 样 被 接受 的 概率 p, 例 如 , 设 某 工厂 购买 气 
硅 酸 原料 , 要求 HsSiFs 的 含量 不 得 低 于 350g * L '， 分 析 方 法 单 次 测定 的 标准 差 为 10g + !. 
根据 值 可 得 表 3-2 的 数据 。 


表 3-2 不 同 实际 含量 x 的 试 样 被 接 受 的 概率 


HH! и Р ж. LTD “ , 
310 A 0, 00003 350 ° 0.5000 
320 3 0.0014 380 -1 0,8413 
330 2 0,0228 370 一 2 0.9772 
340 1 0.1587 380 1 —3 0. 9986 
XPBUR p 对 工作 图 (图 3-2)， 可 得 抽检 特性 曲线 ,简称 OC 曲线 。 


pide (3-2) 可 见 , 含量 为 340g L 1.0 
原料 有 15.9 儿 的 概率 被 接受 ， 如 果 希 望 接 
受 这 样 的 原料 的 概率 降低 至 2% , 可 采用 两 
个 方法 。 第 一 个 办 法 是 提高 接受 标准 , 从 标 = "时 
RESHMA, ре 20, u 值 应 取 
2. 05 ARA к 的 表达 式 可 求 出 ze (使 对 应 于 | 
记 =2% 的 z+ 为 340),zo 应 为 360g* L^, BD 0.2 
将 接受 标准 改 为 360g - L U, ERADHA о 
法 的 误差 不 变 的 条 件 下 ,实际 含量 为 
340g * L. 1! 的 原料 被 接受 的 概率 将 降 至 
2%。 另 一 个 办 法 是 改善 标准 差 6, 因 o 是 采 图 3-2 计量 抽样 检验 的 OC 曲线 
样 误差 和 分 析 误差 之 和 ， 与 采样 及 测定 次 数 有 关 ， 吕 oxo 1 YN， 分 析 方 法 一 次 测定 标准 差 
为 a， 本 例 为 10g LOS Жо АЖ (3-31) ф, TRE n. 

n= (2.05 X10°)/(350— 3400224 

PT 4 GRRE (分析),， 可 在 原 定 接受 标准 下 。， 将 接受 实际 含量 为 340g，L ' 的 原料 的 概率 
下 降 至 2%。 

采用 序 贯 采样 法 可 减少 检验 工作 量 。 先 取 少 量 试 样 作 定量 分 析 检 验 。 如 结果 显示 其 定量 
指标 显然 在 要 求 范围 之 内 或 之 外 ， 即 可 作出 会 或 不 合格 的 决策 ， 如 分 析 结 果 人 靠近 指标 的 边 


KI 
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із 


二 


320 330 340 350 360 370 380 


x 
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缘 , 则 作 进 一 步 采样 检验 ， 直 至 有 把 握 作 出 决策 。 定 量 分 析 结果 提供 的 数值 信息 .此 时 可 加 
以 充分 利用 ， 从 而 减少 进一步 的 工作 量 〈 试 与 下 面 讨论 的 计数 抽样 检验 比较 )。 

序 侦 检验 法 按 如 下 步骤 进行 。 取 一 组 共 个 试 样 , 分析 得 出 均值 Жр 值 与 接受 /拒绝 
标准 比较 ， 今 zo 为 给 定 的 生产 者 风险 a 值 KE, UAE, IVER RL) 对 应 的 
х, r 为 给 定 的 消费 者 风险 8 值 (第 二 类 错误 ， 以 假 当真 ， 即 消费 者 风险 ) 对 应 的 x ШЫ 
nz 的 关系 如 下 ， 


дупу Fr, )/2+h, (3-32a) 
xy—nGad we) /2 -he (3- 32b) 
式 (3-32a) 和 和 式 (3-32b) 中 
Боа O- e)/8]; traz, ) (3-33a) 
һв=ойа[ (1—)/в]/ с) (3-33b) 


AP, o, 为 表征 整 批 试 样 成 分 变化 情况 的 标准 差 ,可恨 据 原 有 检验 记录 资料 计算 求 得 , 如 z fi 
大 于 = 或 小 于 zo， 可 作出 判决 , 拒 收 或 接受 该 批 产品 ; 如 > An 与 z 之 间 ， 继 续 采 样 分 
Wr. 再 计算 累计 的 值 . 用 序 贯 抽样 法 可 采集 较 少 试 样 数 《n》 进 行 质量 判决 ， 如 产品 批 的 真 
HIGH zx， 此 时 需 采 集 的 试 样 数 为 

n,7,7:26* (0 —a@) lal (1 —a)/8]-aln[ (0. —58)/2]) / Gy — 2. 
T] z EA z, 或 居于 二 者 之 间 时 的 = 值 为 

пъ 204 (1 Ва [1 8) 7а] Bln[ (Q a) / 87} / Gr — ez)? 

па = 20° {ln[ 0- 0 а) x Int A) a], Ga — z.) 
RILA n HNT- CORR UD BB RE, 


=. Wh Ede 


这 种 检验 方法 多 用 于 以 件 计数 的 产品 检验 ， 如 采用 化 学 分 析 方 法 ， 则 是 作 定性 分 析 提 供 
检验 对 象 是 否 合格 的 属性 ， 例 如 用 看 谱 镜 确定 某 种 杂质 存在 或 不 存在 。 由 于 这 里 只 有 一 比 特 
信息 量 〈 合 格 或 不 合格 两 种 可 能 性 )， 较 定量 分 析 提 供 的 信息 量 低 ， 这 种 情况 的 采样 检验 需 用 
不 同 的 统计 方法 处 理 。 

RUE HUE N 个 试 样 ,如 其 中 不 合格 的 占 p ARRS g 取 RERE c 个 不 合格 试 
样 的 概率 P. 可 按 超 几 何 分 布 计算 为 

PN | 


P.= 
而 采集 = 个 试 样 检 验 , 如 规定 其 中 只 有 a 个 不 合格 时 可 接受 , 则 被 接受 的 概率 为 
a “T IPNI IN — pN L: N 
r= Dr DG C 


ihn 


N—pN 


n-c 


Ni 


n 


г=0 с л c 
当 ， 值 很 大 时 上 式 计算 量 大 , 即 Noob, AIS} 
tmp, = gn УА] 
ZH 
cl 


一 般 当 N 足够 大 (例如 N2>10n)B , Ela] JH Est e P, 可 计算 为 
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Hn 


Р, = >>. = Z ra = py 
B N RABKIN R PHEWE. BU Cho. 1) 的 条 件 , 则 可 用 更 简洁 的 Poisson $y ff 
作 近 仆 计算 ， 
Р, = Уру "= 1— SI Oo py sere „ 
LP, RHESOE HOYT EER I OC 基线 ,这 种 计算 结果 示 于 家 33。 
表 3-3 产品 不 合格 率 与 接受 概率 的 关系 


_ | RAEE n атава 接受 概率 P 
RASSE | а 2-30 |  a«-100 n=500 
P n=80 a-100 | n=500 ul 422 4-10 
9.5 0.25 DH 2.5 0.974 c. 986 1.000 
1.0 0.5 1.0 5.0 0.910 C. 920 0.986 
1.5 0.75 15 1.5 0.827 с, 809 0.863 
2.0 10 20 10.0 9.736 0.677 0. 583 
2.5 1.25 2.5 12.5 0.645 0. 597 0.297 
3.0 18 © 15.0 0.558 | 0423 9.118 
4.0 2.0 о 20.0 0.406 0.238 aol 
5.0 2.5 5.0 25.0 0.288 | 0.125 0.001 
10.0 5.0 19.0 50,0 0. 040 0.003 0.000 


由 表 3-3 可 以 看 出 ， 如 制定 的 抽样 检验 方案 是 取 50 个 样 检验 ， 出 现 1 个 或 无 不 合格 品 时 
接受 该 批 坛 样 , 这 并 不 意味 着 产品 的 不 合格 率 一 定 是 小 于 2%, 不 合格 率 为 4% 的 产品 批 , 仍 
有 40% 的 概率 被 接受 ， 这 就 是 消费 者 的 风险 。 反 之， 1%% 不 合格 率 的 产品 , 有 《1 一 0. 910) BJ 
эм M63 ecd ШЕ, 这 就 是 生产 者 的 风险 .要 完全 消 除 这 两 者 风险 , 只 有 进行 试 样 的 全 部 数 检 ， 
而 这 需要 耗费 很 大 的 人 力 和 物力 。 序 贯 抽样 检验 能 减少 达到 相同 的 风险 水 平 需要 的 采样 个 数 。 
ho 是 与 给 定 生产 者 风险 (1 一 对 应 的 整 批 产品 应 予 接受 时 的 不 合格 产品 百分数 ， 这 个 可 
接受 质量 水 平 称 AQL CAcceptahle Quality Level), а, 是 与 消费 者 风险 В 相对 应 的 整 批 产品 应 
子 拒 收 时 的 不 合格 产品 百分数 ， 这 个 应 予 拒 收 的 质量 水 平 称 批 不 合 恪 品 百分数 的 允许 界限 
LTPD (lot tolerance percent defective), SH n 个 试 样 检验 ， 如 发 现 有 a 个 不 合格 ,将 a 与 
а, ar Ш: 

= 一 和 十 sn (3-34a) 
а= ып (3-34b) 
X (3-34) 中 
з= (а, а.) Лаба, ѓа) 
hy=In[ 1—a)/8)An(a,/a.) 
Һа 8) /e/1n(a,/a,) 
di aca, ЖИЕ” RE M аа, $E eH p= ma а Ж а, ^ а, 2718 MERAH RRR 
aja, 进行 判决 。 

对 质量 从 符合 AQL 的 一 批 产品 ,采样 数 的 期 望 值 为 

„(а= 001—0), ah, ]/(s—a,) (3-35) 
HARRA LTPD 的 一 批 产品 , 则 有 
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nla d= LO — 8h — Bh, ]/ (a, —5) (3-36) 
FRAP SR HI EARN (hihi /s), oh BL KF AGE з. 
Ж 3-3 的 数据 表明 ,如 果 不 用 序 贯 采样 法 , 取 500 个 样 检验 , 当 不 合格 品 大 于 10 时 拒 收 ， 
则 拒 收 会 1. 5% Ca,—0- 015) 不 合格 品 的 生产 者 风险 a 为 (1 一 0.86) 一 0, 14, 接 受 含 3. 0% (a= 
0. 03) 不 合格 品 的 消费 者 风险 8 为 0, 12, 此 时 可 算得 А, =2.8413,һ,=2. 6531,5=0. 0216, BI 
а= —2. 8413—0. 0216n 
a,=2. 6531+0. 0216n 
这 时 采样 数 的 最 大 期 望 值 为 349, 即 维持 同样 水 平 的 牛 产 着 风险 与 消费 者 风险 , 在 最 不 和 的 情 
ИЕЛЕ ЖЕ 500 个 试 样 进行 检验 。 按 此 法 检验 ， 可 先 采 150 个 样 检验 , 此 时 а =0 (如 无 
不 合格 品 ， 则 接受 )， a,=6 (如 大 于 或 等 于 6 个 不 合格 品 . 则 拒 收 ), 如 不 合格 品 在 a. 与 a: 之 
间 ， 再 采集 150 个 样 ， 此 时 a 54, а, 为 9， 余 类 推 ,对 质量 恰 符 合 AQL (1. 5% 不 合格 率 ) 
的 产品 ， 采样 数 的 期 望 值 为 314, 对 恰 符 合 LTPD 的 产品 , 采样 数 的 期 望 值 为 237。 在 确保 所 
需 的 产品 质量 标准 下 ， 此 法 显然 能 减少 检验 工作 量 ， 降 低 生 产 成 本 。 
采用 科学 的 检验 方法 ,是 发 达 国 家 如 日 本 确保 其 产品 质 优 (退货 率 低 , BD 8 低 ), H YS 
合理 〈 尽 可 能 低 的 a) 的 诀 窒 .而 有 的 生产 部 门 由 于 分 析 检 验 人 员 缺 乏 统计 采样 知识 , 不 能 理 
解 或 拒 不 使 用 本 章 论 及 的 采样 方法 ， 沿 用 一 些 缺 乏 科学 根据 的 采样 方法 ， 例 如 “固定 比例 抽 
检 法 ”， 导 致 产品 质量 长 期 不 能 改善 (8 Ë) 或 生产 成 本 高 (a 高 )。 显然 , 普及 有 关 采 样 理论 
知识 ， 具 有 重要 的 实际 意义 。 
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SOS ”化 学 试验 设计 与 优化 方法 


第 一 节 mox 


本 章 介绍 分 析 化 学 中 试验 设计 与 优化 方法 ， 第 一 部 分 以 日 前 统计 学 中 最 重要 的 实验 设计 
体系 ， 即 因子 设计 及 部 分 因子 设计 、 正 交 试 验 设计 、 均 匀 试 验 设计 、 最 优 设 计 为 主要 对 象 来 
介绍 该 研究 领域 的 主要 成 果 。 混 料 试验 设计 为 上述 试验 设计 的 一 种 特殊 情况 ， 具有 其 特殊 性 ， 
故 也 分 出 -- 节 来 专门 介绍 。 对 子 已 为 广大 化 学 计量 学 家 熟悉 的 单纯 形 方法 亦 将 给 出 必要 的 介 
绍 。 对 子 部 分 因子 设计 、 正 交 试 验 设计 和 均匀 试验 设计 中 的 一 些 必要 的 表格 也 将 给 出 、 以 备 
读者 使 用 .第 二 部 分 以 目前 应 用 数学 中 发 展 的 优化 算法 为 主线 ， 特 别 对 化 学 计量 学 中 常用 优 
化 方法 给 出 较 详 细 的 介绍 。 介 绍 将 分 局 部 优化 算法 和 全 局 优化 算法 两 部 分 来 进行 阐述 。 在 介 
绍 经 典 的 局 部 最 优 方法 方面 ， 以 在 化 学 中 得 到 广泛 运 出 的 方法 为 主 ; 在 介绍 全 局 最 优 方法 方 
面 ， 首 先 将 目前 在 化 学 计量 学 研究 中 备 受 关注 的 随机 导 优 法 ， 即 模拟 退火 算法 和 遗传 算法 给 
出 较 详 细 的 介绍 ,然后 对 伪 蒙 特 卡 罗 法 ， 即 基于 数论 方法 的 序 贯 优化 法 也 作出 介绍 。 对 这 三 
种 方法 都 将 给 出 其 计算 机 程序 ， 供 读者 查考 。 

从 目前 的 情况 看 ,整个 化 学 学 科 实际 上 还 是 一 门 以 实验 研究 为 主 的 自然 科学 的 分 支 学 科 ， 
所 以 有 关 如 何 通过 试验 设计 的 方法 来 最 有 效 地 获取 相应 的 化 学 信息 ， 以 达到 最 优 进行 化 学 反 
应 的 条 件 应 是 化 学 乃至 化 工 研究 中 的 一 个 十 分 重要 的 问题 。 就 分 析 化 学 而 言 ， 通 过 试验 设计 
以 找到 最 优 的 量 测 实验 条 件 一 直 是 化 学 计量 学 研究 的 一 个 重要 内 容 。 如 色谱 分 析 中 的 最 优 分 
离 条 件 的 选择 、 各 种 仪器 分 析 方 法 中 的 诸多 参量 的 选择 等 。 可 以 这 人 么 说 , 对 子 化 学 量 测 实验 ， 
试验 设计 的 成 败 ， 关 系 到 实验 能 否 得 到 包含 所 需 信息 的 化 学 量 测 数据 ， 一 个 失败 的 试验 设计 
将 导致 所 得 到 的 数据 中 包含 的 信息 量 极 低 ， 任 何 卓 有 成 效 的 处 理 数据 的 化 学 计量 学 方法 也 无 
法 从 中 提取 有 用 的 信息 。 在 系统 讨论 试验 设计 方法 之 前 ， 在 此 将 这 一 领域 的 基本 概念 及 常用 
术语 给 出 必要 的 介绍 。 

在 试验 设计 中 ， 衡量 试验 效果 的 量 称 为 试验 指标 简称 指标 或 响应 值 ， 能 用 数值 表述 
的 指标 称 定量 指标 ， 如 化 学 反应 的 产 率 、 分 析 试 验 的 检测 限 或 其 他 品质 因数 等 。 亦 有 不 是 用 
量 表示 的 指标 ， 如 化 学 产品 的 色 度 等 ， 这 种 指标 称 为 定性 指标 。 定 性 指标 常 可 转化 为 定量 指 
标 ， 如 用 5 级 计 分 进行 评分 等 。 当 试验 设计 的 指标 要 用 一 组 数 表示 时 ， 如 分 析 方 法 的 优化 需 
考虑 灵敏 度 、 准 确 度 、 选 择 性 等 ， 称 多 指标 试验 设计 的 问题 。 

完成 一 项 试验 ， 得 到 指标 的 试验 观测 值 ， 以 у 表示 。 当 改变 试验 条 件 时 ， 指 标 y 将 发 生 
变化 ， 影响 y 取 值 的 量 称 为 因素 《 亦 称 因子 )， 因 素 也 可 以 是 定量 因素 或 定性 因素 ， 和 指标 一 
样 ， 定 性 因素 总 是 可 转化 为 定量 因素 。 因 素 在 试验 中 的 状态 ， 例 如 定量 因素 的 取 值 ， 称 为 因 
Ж RAF) 的 水 平 。 一 般 试验 方案 是 由 若干 个 试验 组 成 ， 因 素 在 这 些 试验 中 变化 了 元 种 状 
态 就 称 为 几 种 水 平 。 在 试验 中 ， 有 的 因素 所 处 的 状态 是 不 可 控制 的 例如 在 自然 条 件 下 进行 
的 某 些 试验 ， 但 一 般 化 学 实验 的 条 件 多 是 可 以 控制 的 ， 本 章 将 主要 研究 可 控 因 素 。 在 试验 设 
计 中 ， 只 对 可 控 因 素 在 试验 前 作出 设计 ， 而 对 不 可 控 因 素 、 则 在 试验 过 程 中 记录 其 水 平 ， 在 
数据 分 析 中 加 以 处 理 。 
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根据 影响 指标 的 因素 的 多 少 ， 试 验 可 分 为 单 因素 试验 和 多 因素 试验 ， 化 学 试验 包括 分 析 
化 学 量 测试 验 一 般 均 是 多 因素 试验 , 用 z. ro о 表示 试验 中 的 个 因素 ,这 个 因素 
的 可 能 取 值 的 区 域 称 为 试验 域 ， 记 为 路 ，y 可 看 成 定义 在 R ао 

у= f(r) 
ЖЕ Газда), ABRIR CODE Re TAK п DEKH EYER 
好 的 选择 ,但 多 数 化 学 试验 中 ,函数 f(. ) 不 能 完全 明了 .这 时 无 法 直接 写 出 ГС ) 的 数学 表达 
式 ， 一 种 方法 是 通过 大 量 试验 构造 -一 类 函数 来 逼近 这 些 试验 数据 ,然后 上航 从 函数 求 最 优 解 ,并 
通过 试验 验证 . 另 一 种 方法 是 不 研究 试验 指标 与 因子 之 间 的 需 数 关系 ,而 只 寻求 试验 指标 最 优 
的 诸 因 素 取 值 ,这 种 方法 称 为 “黑箱 ” 式 方法 。 

所 亩 试验 设 计 ,归根 结 底 是 如 何在 试验 域 上 最 有 效 地 选择 试验 点 ,通过 试验 得 到 指标 (或 
响应 的 观测 值 ,然后 进行 数据 分 析 求 得 指标 (或 响应 ) 取 最 优 值 的 条 件 。 因此 ,试验 设计 的 目 
标 ,就 是 要 用 较 少 的 试验 取得 关于 f(x) 尽 可 能 充分 的 信息 。 

虽然 在 化 学 实验 研究 中 大 多 是 多 变量 体系 . 
可 是 .化 学 文献 特别 是 分 析 化 学 文献 中 许多 有 关 
试验 的 报道 本 质 上 是 按 单 因素 试验 设计 的 , 即 通 
常 在 化 学 试验 中 采用 的 每 次 只 变动 一 个 因素 而 辐 
定 其 他 因素 的 设计 方法 ,这 种 方法 当然 是 最 简单 
和 最 直观 的 ,然而 ,一 般 说 来 ,对 于 绝 大 多 数 多 因 
素 化 学 体系 ,用 这 种 方法 来 设计 试验 ,是 很 礁 找到 
真正 的 最 优 实验 条 件 的 .在 许多 情况 下 ,得 到 的 结 
果 并 不 是 最 优 的 因子 水 平 《参见 图 4-1)。 

Bir 同 定 其 他 变量 变动 一 个 在 试验 设计 和 优化 中 ,还 可 区 分 同时 试验 与 

变量 的 寻求 最 优 实验 条 件 所 得 结果 示意 图 序 贯 试验 两 种 工作 方法 所谓 同 时 试验 ,就 是 通过 

1 固定 变动 o 找到 的 第 一 个 最 优点 ; 试验 设计 对 有 关 因 素 的 水 平 进行 规划 后 ,同时 进 

2 一 国定 ze, 变动 cs 找到 的 第 二 个 最 优点 行 诸 因子 各 水 平 的 试验 ,然后 综合 分 析 得 到 的 试 

验 结果 , 求 出 最 优 条 件 。 另 一 种 方法 是 每 进行 一 次 或 少数 几 次 试验 后 , 先 分 析 已 取得 的 试验 结 

果 , 再 根据 这 些 结果 规划 下 一 步 的 试验 ,这 样 序 贯 试验 向 最 优 条 件 通 近 。 目 前 应 用 广泛 的 正 交 

试验 或 称 为 部 分 因子 试验 ,均匀 试验 设计 及 最 优 试 验 设计 基本 上 属于 同时 试验 法 ,而 序 贯 试验 
法 的 典型 代表 是 单纯 形 优化 法 。 同 时 试验 与 序 贰 试验 可 在 优化 试验 中 综合 使 用 ， 


第 二 节 ”因子 设计 及 析 因 分 析 方法 


所 谓 因子 设计 实际 上 是 一 种 多 因素 试验 设计 方法 0 ……, 它 通常 可 由 多 种 因素 的 水 平 数 的 
一 个 乘积 表 来 表示 。 如 一 个 三 因子 二 水 平 的 因子 设计 可 由 名 来 表示 , 亦 即 2X2X2, 需 进行 
8 次 试验 ;而 一 个 四 因子 三 水 平 的 因子 设计 则 可 由 3: 来 表示 , 亦 即 3X3X3X3. 需 共 进 行 81 次 
试验 。 因 子 设计 的 任务 就 是 要 通过 这 样 的 试验 安排 来 了 解 各 个 因素 及 各 因素 水 平 之 间 的 搭配 
对 响应 值 或 指标 的 影响 , 即 析 因 问 题 。 故 析 因 问题 是 因子 设计 的 主要 研究 的 问题 之 一 。 下 而 我 
们 将 通过 一 个 具体 的 二 水 平 三 因子 试验 设计 的 例子 来 具体 说 明 因子 设计 中 析 因 分 析 的 主要 思 
路 和 方法 。 

以 用 反 向 高 效 液 相 色谱 分 离 酚 类 为 例 。 在 此 ,主要 考察 三 个 因素 ,人 流动 相 中 甲醇 的 比例 
(流动 相 ; 水 各 甲醇) 为 70% 与 80% ;加 乙酸 的 浓度 (mol * LDW 0. 004 和 0.01; @ PERR 


E 
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Bg L 为 2 和 6。 由 此 可 以 得 全 由 表 4-1 给 出 的 -个 试验 设计 表 , 在 此 ,响应 值 色谱 分 离 
度 是 一 个 判别 整个 分 析 过 程 酚 类 物质 分 离 程度 的 一 个 度量 。 其 值 越 大 说 明 分 离 效 果 越 好 . 


表 4-1 RAGRRAGRA SHAN AFBI RO) 


Maka omnet PERAE Het BIEREN IE 
1 B - j| 10.0 E 
2 + 一 9.5 
3 + _ 11.0 
4 + + _ 10.7 
5 一 十 9.3 
6 + 一 十 8.8 
7 t + 11.9 
8 l + 11.7 


D ZEHE (Acetic acid, A), (单位 为 mol + L700:0.004€7 00-0104. 
@ FLA CMerhol MD Ciz оК ТВ) 70940 уво, 
@ FIERE CCiurie acid C) CRUS g 1. 0:207) 608. 


一 、 主 效应 的 估价 


在 上 述 试 验 中 ， 我 们 最 先 想 知道 的 当然 是 每 一 种 因素 对 分 离 的 贡献 ， 也 就 是 说 每 种 因子 
对 于 试验 效果 的 主 效应 。 从 表 中 我 们 可 以 看 到 ， 对 于 乙酸 而 言 ， 试验 序号 1 和 2 的 差别 就 在 
于 乙酸 ， 别 的 条 件 都 一 样 。 同 理 ， 试 验 序号 3 和 4、5 和 6、7 和 8 对 于 乙酸 而 言 也 都 是 一 样 ， 
所 以 ， 要 求 乙 酸 对 分 离 效 果 的 主 效应 可 通过 下 式 求 得 
Е m [Os у) + Су — y0- Qs y Os — у+) 1/4 
=[(9.5—10.0)—(10.7—11.0)-+- (8. 8—9. 3) -- (11. 7—11.9)]/4 
——0.375 
因此 ,将 乙酸 浓度 从 0. 004 增加 到 0. 01 (mol * L- ) 将 对 分 离 效 果 产 生 负 作用 。 同 理 ,可 以 通过 
表 4-1 分 别 算出 甲醇 和 柠 榜 酸 的 主 效应 
ERE ao m [Oty tyty) 7 On угуз y 1/4 
—[1. 04-10. 2-11. 94-11. 2) — (10. 0+9. 5+9. 3 十 &, 8) ]/4 
—]. 925 
ERM rem =COst ve yet y0 7 Ont yet у) 1/4 
一 [(9. 3 十 8. 84-11. 9411. 72 — (10. 04-8. 54-11. 04-10. 7) ]/4 
=0. 125 
从 上 述 计算 可 以 看 出 , 根据 表 4-1 的 数据 , 对 于 每 一 个 因素 , 只 要 将 正 号 的 响应 值 加 合 起 来 减 
去 带 负 号 的 响应 值 之 和 ， 就 得 到 了 每 个 因素 的 主 效应 。 值 得 指出 的 是 ， 对 于 这 样 的 2 因子 设 
计 , 如 图 4-2 示 出 的 立体 直观 图 是 十 分 有 用 的 , 从 图 我 们 就 可 直观 地 看 出 各 因素 的 主体 效应 。 


二 、 交 叉 效 应 的 估价 


如 果 所 研究 的 对 象 为 一 线性 模型 ， 则 主 效应 的 计算 就 说 明了 它们 本 身 对 于 模型 影响 的 大 
小 ， 吕 是 ， 在 绝 大 多 数 的 实际 问题 中 ， 都 存在 着 所 谓 的 交叉 效应 ， 所 以 ,在 估价 了 它们 自身 
的 主 效应 之 后 ， 一 般 都 需要 继续 估价 交叉 效应 。 
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DUCI E 


0.004 0.01 
218/017) 


图 4-2 РИНВИ МИ 


次 先 ， 是 定性 识别 是 否 存在 交叉 效应 。 我 们 只 需 将 两 个 不 同 央 素 克 响应 值 作 图 ， 就 很 容 
易 看 出 该 两 因素 是 否 存在 着 交叉 效应 。 图 4-3 就 给 出 了 这 样 一 个 采用 作 图 方法 来 鉴别 是 否 存 
在 交叉 效应 的 例子 。 从 图 4-3 所 示 的 情况 不 难 理解 , 如 果 图 中 的 两 条 直线 平行 , 则 说 明 第 二 个 
因素 变化 对 第 一 个 因素 的 主 效应 没有 影响 ， 也 就 是 说 ,第 二 个 因素 的 变化 引起 的 响应 值 的 变 
化 与 第 一 个 因素 变化 时 对 响应 值 的 影响 是 可 以 线性 本 加 的 ; 反之 ， 如果 图 中 的 两 条 直线 个 平 
行 ， 则 说 明 在 第 二 个 因素 发 生变 化 时 ， 第 一 个 因素 的 变化 将 或 是 加 强 或 是 减弱 第 二 因素 对 响 
应 值 的 误 应 ， 这 正 说 明了 该 两 因素 存在 交叉 效应 。 这 样 的 交叉 效应 在 化 学 化 工 的 研究 实践 中 
是 很 常见 的 。 


га т 


(a "n 
图 4-3 ”是否 存在 交叉 次 应 的 示意 图 
fa) 不 同 两 线 平行 ， 说 明 不 存在 交叉 效应 ，(b) 不同 <! 两 线 不 平行 ， 说 明 存 在 交叉 效应 
从 图 4-2 还 可 以 很 清楚 地 看 出 不 同 水 平 的 响应 值 的 差别 。 对 于 柠檬 酸 和 甲醇 的 交叉 效应 ， 
也 可 以 从 图 中 看 出 ， 这 是 因为 对 于 甲 蔡 效应 在 柠 榜 酸 浓度 为 6g，L™' 时 效 明 显 大 于 在 柠 棕 酸 
浓度 为 2g，L7 时 效应 ,这 就 说 明 甲醇 效应 和 柠 榜 酸 的 效应 不 具有 线性 加 合 性 , 它们 之 间 存在 
着 交叉 效应 。 此 交 丸 效应 可 通过 以 下 步 又 来 进行 具体 计算 。 先 估价 柠檬 酸 不 同 水 平 的 甲醇 平 
均 效 应 , 即 当 柠檬 酸 为 6g，L !* 时 ,甲醇 的 平均 效应 为 [ys 一 0) 十 (yr 一 y5)]/2 王 《2.9 十 2. 6)/ 
2=2. 75; MERA 2g 。L-' 时 ,甲醇 的 平均 效应 为 [(y yd) H O8  y01/2- O- 2 十 
1.0)/2 一 1. 1; 然 后 ,将 所 得 两 数 相 碱 ,继续 除 以 2, 即 得 到 了 甲醇 对 柠 榜 酚 的 交叉 效应 值 , 即 
ЖА Л аннан = (Oey От) 1/27 Lyd 6703/22 
= (C2. 9+2. 6)/2— Q. 241. 0/23 /2 
= (2.75 —-1-1)/2=0. 825 
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FB BILE TER (0 2: IB W 2 13358 5S TP IU 22 3 ЖОЛУ SH E] PPE ELI X ЖУ 
还 可 以 从 先 估价 甲醇 不 同 水 平 的 柠檬 酸 平 均 效应 ,再 按 上 述 过 程 进 行 计算 , 即 
ZUA wasan = Gs y) Gn уз) 1/2— Ls y) + Gs 750 1/2072 
={(1.0+0.9)/2—(—0.7 0.7)/2)/2 
=(0.95+0.7)/2=0.825 
ЖЖЖИ EHER EK F + PB 


н Бән уо tyi 7 ув в уат 
ЖЖЖ натро = — = = 


=0. 825 
这 样 ,对 于 交叉 效应 同样 可 以 通过 如 图 4-2 的 立体 直观 图 来 表示 ,对 于 交叉 效应 的 立体 直观 图 
示 于 图 4-4. 图 4-4 由 三 个 于 图 给 出 ,最 上 面 的 图 , 即 图 4.4(a), 则 表示 了 乙酸 和 甲醇 的 交叉 效 
应 ,其 中 由 带 ( 十 ) 号 的 平面 所 连 的 4 个 顶点 ,表示 在 计算 中 它们 的 符号 都 取 正 值 , 面 由 带 ( 一 》 
号 的 平面 所 连 的 4 个 顶点 则 取 负 值 ,所 以 ,如 果 要 计算 乙酸 和 甲醇 的 交叉 效应 ,就 可 直接 用 于 


式 进 行 计算 : 
VR cmm ate tty, Wurst eros 


—11.7+9.34+10.7+10.0 . 11. 9+8. 8+11.04+9.5 
4 4 


=0. 125 
同 理 , 也 可 以 参照 图 4-4(b) 来 计算 乙酸 和 柠檬 酸 的 交叉 效应 , 即 


十 十 > i 
ЖЖ иннин, = M» У L ys Dus 


—11.738.8c11.0010.0 11.99.3010 79.5 
4 4 


Z 


b) 
图 4-4 交叉 效应 立体 直观 图 
图 中 顶点 编号 同 图 4 2 
(a) ZARA) ATF ECA) EU (b ZR CAEP RRR OD YE BT 
O PREC MAU FPRRER GO M ОРУ 


同时 ， 还 可 以 用 交叉 效应 立体 直观 图 来 计算 乙酸 、 甲 醇和 柠檬 酸 的 三 项 交叉 效应 。 在 图 
4-4 (a) 中 ， 当 柠檬 酸 的 水 平 为 68* L ' 时 ， 甲 醇和 乙酸 交叉 效应 的 培 响 可 由 下 式 给 出 


Wizy) mys) _ (11-7—11.9)—(8.8—9.3) _ 
2 2 


ТОЧ КЕНЕШКЕ 2g + om IP, RGR Z BE SUR a oB RU h FRAN 


Ол 28) — Ов) (10.7—11.0) — (9. 5—10. 0) 
2 2 


ВТО. 乙酸、 甲醇 和 柠檬 酸 的 三 项 交叉 效应 为 


= 0.15 


9.1 
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同样 ， 也 可 以 由 图 4-4 (b) 或 图 4-4 (GO 米 计 算 三 项 实 叉 效应 ， 所 得 结果 一 样 。 

另外 , 还 可 直接 用 表 4-1 给 出 的 因子 设计 表 (20 来 得 到 交叉 项 计算 的 符号 . 算法 很 简单 ， 
只 需 将 要 计算 的 交叉 项 在 表 中 的 符 续 相 乘 ， 根 据 正 正 得 正 、 抽 负 得 正 利 正 负 得 负 的 原则 ， 即 
f 计 算出 所 有 交叉 项 的 符号 来 。 表 4.2 给 出 了 据 此 原则 得 出 的 2: 因子 设计 表 的 全 部 主 项 及 交 
叉 项 计算 表 ， 只 需 根 据 此 表 就 可 容易 地 得 到 计算 各 种 效应 所 需 的 符号 来 。 

#42 г 因 于 设计 的 全 部 主 项 下 交叉 项 计算 符号 表 5 


=| 


编号 A M c AM АС м АМС 色谱 分 离 度 
1 一 I 一 十 EM ` + Е 7 10.0 B 
2 + - , + + 9.5 
3 + - | L 一 + ` п.0 
ñ - + - + | 10.7 
5 _ _ + = | = 一 9.3 
6 + + _ + 一 一 RE 
7 _ + + | ; + _ 11.9 
8 + + ~ | + u u 一 11.7 
Ë, A— LEA (mol L 1), 0.004 (CO MOL C225 


M— PREA (ИЗИН. 水 和 甲醇 ): 7076 (一 ) 与 80% (+); 
Com ЮЕ (gL), 2 (一 ) 和 6 (+): 
AM. AC, MC. AMC— MARAR RRA CACHE 


以 上 情况 虽 只 是 以 2 因子 设计 为 例 来 进行 说 明 , 其实, 其 基本 原理 将 对 别 的 因子 设计 的 
情况 都 是 适用 的 。 


兰 、 效 应 及 残 差 正 态 图 


以 上 讨论 了 因子 设计 的 主 效应 及 交叉 效应 的 计算 ,实际 上， 还 需 对 这 些 效应 进行 统计 售 
价 ， 即 决定 哪些 效应 将 在 模型 建立 时 需要 考虑 ， 哪 些 则 可 以 忽略 ， 效 应 正 态 图 即 可 以 用 来 进 
行 这 样 的 决断 而 残 差 正 态 图 则 可 用 来 进行 判断 所 得 模型 是 否 合理 。 

因为 正 态 分 布 一 般 表示 为 由 多 种 不 定 因素 而 产生 出 来 的 一 种 分 布 ， 所 以 ， 如 果 某 些 效应 
是 服从 正 态 分 布 的 话 就 可 认为 它们 实际 对 实验 不 产生 显著 影响 。 用 以 检测 一 系列 变量 是 否 服 
从 正 态 分 布 的 最 简易 方法 就 是 采用 正 态 分 布 图 来 对 它们 进行 检验 。 正 态 分 布 图 的 构造 可 由 以 
下 步骤 来 完成 ， 

CD 先 将 要 检验 的 一 系列 变量 按 大 小 进行 排列 , 对 于 已 得 到 的 各 种 效应 可 得 如 表 4-3 所 示 
的 排列 ， 

® 计算 累积 概率 : 对 子 有 了 个 数据 的 系列 ， 可 根据 以 下 公式 来 计算 它们 的 累积 概率 


—0.5 
T 


P= 031004 Q-D 


式 中 ,PP, 一 累积 概率 ,%。 
© 以 需 检 验 变量 的 标 度 为 x 轴 , 以 累积 概率 为 y 轴 作 图 ,在 图 上 能 用 一 条 直线 描述 的 变 
量 可 视 为 是 服从 正 态 分 布 的 变量 。 


Жаз 色谱 分 离 试验 所 得 各 种 效 频 的 顺序 排列 表 ” 


效应 名 称 A AC AMC c | AM MC M 
效应 数值 “| 一 0. 375 0.025 0.025 v1 [| 0.125 0.825 1.925 
жж | ^u 21.43 35.71 50 64. 88 78.87 92. 86 


D 此 表 所 用 符号 同 表 1-2. 


由 表 1-3 所 示 的 色谱 分 离 试 验 所 得 各 种 效应 的 正 态 分 布 图 示 于 图 4-5, 从 图 可 以 看 出 , 效 
应 AC( 乙 琶 与 柠 榜 酸 的 交叉 效应 )、4MC (甲醇 .乙酸 与 柠檬 酸 的 二 项 交叉 效应 ).C( 柠 檬 酸 的 
主 效 应 ) 以 及 AM( 乙 酸 与 甲醇 的 交叉 效应 ) 正 好 落 在 … 条 直线 上 ,说 明 它们 对 试验 的 影响 很 
小 ,可 以 忽略 。 于 是 ,如 果 需 要 对 此 色谱 分 离 试验 建立 回归 模型 的 话 ,就 只 需 选择 乙酸 (4) UR 


醇 (M) 和 甲醇 与 柠 榜 酸 的 交叉 效应 LMC) 来 建立 机 
y=10.363—(0.375/2)z + (1. 


应 的 模型 就 可 以 了 、 经 对 数据 建 模 可 得 


925/ 2 dary + C0. 825/2)rue 


M 


-0.2 


T 
图 4-5 BA NUR RO EROR IER y ñ Bl 


得 到 上 述 回 归 模 型 后 ,可 以 上 


它 来 计算 该 模型 的 残 差 ,如 果 所 得 残 差 淡 上 述 方法 所 得 的 残 差 正 


态 分 布 图 可 用 一 条 直线 表示 的 话 , 涪 明 模型 是 很 合理 的 .用 此 模型 算出 的 残 差 列 于 表 4-4 ,它们 的 残 
差 正 态 分 布 图 示 于 图 4-6。 这 些 残 差点 似 可 通过 一 条 直线 表示 出 ,但 吻合 不 是 很 好 。 


表 44 ЖЛ ИИИ И ЕЕ 


E n H 2 3 4 


| 5 $ 7 8 
实验 值 10,0 9.5 1.0 10.7 | 9.3 8.8 11.9 117 
计算 值 10.0 8.80 1.10 11,55 | 190 8.60 11.10 11.85 
а ж 一 0.0 0.70 —0.10 985 | 7070 —0. 00 0.80 0.15 


从 上 述 讨论 可 知 ， 因 子 设 计 的 确 具 有 不 少 优点 ， 它 不 但 可 方便 她 估价 出 各 种 因素 的 主 效 


应 和 它们 之 间 的 交叉 效应 ， 而 且 还 可 方便 地 建 模 ， 


并 对 模型 进行 相应 的 估价 。 可 是 在 化 学 化 


工 的 实际 研究 中 , 像 因素 只 有 3 个 的 并 不 多 , 而 且 因 素 试验 的 水 平 也 不 可 能 只 限于 2, REA 


素 和 水 平 数 一 增加 ， 因 于 设计 就 显 出 了 它 的 不 足 。 


即使 全 部 因素 均 是 二 水 平 的 ， 当 因素 数 为 


时 ,总 试验 数 就 是 N= 二 2”。 化 学 化 工 的 诸多 研究 常 涉及 很 多 因素 , 例如 多 达 5~10 个 因素 时 ， 
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此 时 如 采用 内 子 设计 ， 试 验 数 就 会 太 多 ， 如 5 个 因素 的 话 就 需要 32 次 试验 ， 如 果 是 10 个 因 
ZHE, BEKAT N 一 2% 一 1024 IK! 而 及， 对 于 这 样 的 因子 设计 ， 其 交叉 效应 的 计算 也 
显著 增加 ， 表 4-5 列 出 了 当 因素 为 2 一 8 时 ， 各 主 效应 和 交叉 效应 所 需 计 算 的 次 数 ， 就 充分 说 


明 因子 设计 在 因素 多 子 5 时 ， 使 用 起 来 就 很 


难 了 。 这 样 ， 就 提出 了 部 分 因子 设计 和 正 交 设 


计 的 方法 来 解决 这 样 的 问题 。 另 外 ， 如 果 因 子 的 水 平 数 很 高 时 ， 就 用 正 交 设计 也 会 感到 试验 


次 数 太 多 ， 于 是 就 产生 了 均匀 设计 方法 。 


P/% i 
93.7 8 T T 
82.2 1 
68.7 6 
56.2 5 
43.8 4| 
31.3 3 | + 
18.8 2 
5.3 1 
71.00 - 0,50 0 0.50 1.00 
E 
图 4-6 色谱 分 离 试验 的 残 差 正 态 分 布 图 
das > 因子 设计 时 需 计算 的 效应 数 ” 
效应 п=? a-8 n=4 п=5 п=6 п=1 n=8 
a z 3 n $ 6 7 8 
2 因素 交叉 1 3 6 10 15 n 28 
3 因素 交叉 1 4 10 20 35 56 
HRZ 1 15 35 70 
5 因素 交叉 1 6 21 56 
Пс 34 1 7 28 
TAXXX 1 8 
8 因素 交叉 1 


(D 训 次 交叉 效应 的 数 月 计算 公式 为 : m Сені (Tel Gem 1013. 
第 三 节 部 分 因子 设计 
对 于 部 分 因子 设计 ,2 水 平 的 设计 方法 比较 成 熟 , 在 此 仅 对 它们 如 何 构 建 及 其 有 关 的 一 些 
重要 理论 和 概念 进行 必要 的 介绍 . 对 于 2 水 平 的 部 分 因子 设计 , 一 般 都 具有 Z WER, AE 
2 表示 因子 的 水 平 数 , n 为 因子 数 〈 或 称 因素 的 数目 )，v 为 可 能 缩小 试验 次 数 的 2 BYR 
ща, 因 试 验 次 数 可 以 缩小 一 半 ， 放 有 半 因 于 设计 法 之 称 ， 当 d 为 2 时 ,试验 次 数 可 
以 降 至 全 因子 设计 所 需 数目 的 1/4， 故 有 四 分 之 一 因子 设计 法 之 称 。 


一 、 半 因 于 设计 法 
所 谓 半 因 子 设计 ， 实 际 上 就 是 2 “次 因子 设计 ， 在 此 为 因子 数 ，2”' 为 其 试验 次 数 ， 因 


其 试验 次 数 实际 上 只 有 全 因子 设计 的 一 半 ， 故 有 半 因 子 设计 之 称 。 在 此 我 们 仍 以 一 个 实际 鲍 
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FRET. W E ЕРЕМЕЕВ ИГР. 
AUTRES, АВИ TE EMRE ОПА 7), Ж (Wir MD. pH 值 
( 简 记 为 Po. MARAE ИЕ 83 CRI DO Ж 2- 氨 基 -2- 甲 基 -1- 历 醇 〈 简 记 为 A) 这 五 个 
因素 有 关 ， 所 以 ， 可 以 构造 一 个 五 因素 两 水 平 的 全 因子 设计 表 来 进行 实验 ， 以 得 到 有 关 磷 酸 
酶 活性 的 主要 影响 因素 等 信息 。 有 关 这 五 个 因子 的 两 个 水 平 示 于 表 4-5, 
Xo 影山 磷酸 入 活性 的 5 个 因子 的 两 水 平 说 明 表 


影响 因素 单 位 * + 
_ + 
z mol + фас? 40 80 
M ито] + dm 72 1.50 2.50 
P 1 10.00 10.70 
D mmol dm ' 10 20 
А L mol < dm 3 0.20 0.60 
由 次 全 因子 设计 所 得 结果 示 于 表 4-7. 
表 4-7 磷酸 酶 活性 2 次 全 因子 设计 结果 
BS + a + 
实验 号 一 一 ~ BEELI | 实验 号 —- 酶 活性 /u7 了 
z M| P | Dia #|мррР |p А 
1 т рә |[- 109 E a [+ 106 — 
a = === | = 13 18 +р-|-|-|+ 120 
a (вр |= 103  " 1-|-l-]|-.-— us 
4 + + _ _ _ 113 20° + + _ _ + 115 
5 —-|-itj-j|- 108 E 一 4 + 109 
6 + - |+ 一 | 一 104 22: 上 一 | 一 | 十 117 
7 = жр 106 2: |-|+у+-р+ 105 
s lt ht} + fod 123 4 +|+| + | - |+ 115 
g f-tf- fe} tin 119 % -|-|+р+ 96 
10 +|р-|-|+{- 146 æ |р+|-|-|+ |+ 128 
u -|+| | - |+ |- ul aw | - frp pt |+ 35 
we f+] + fof ed - 143 28 + +|- |+ Í+ 127 
13 = |= |ж рв 118 297 -]- |+ | + |+ 99 
wef +] — рж рж 145 30 А | +| + |+ 131 
wr f- ++] + | - 110 зі = |+ [+ 92 
в pt [+] +i + | = 148 at | 一 +| + | + 132 
(Ü 10= апо] + min !=16- 67nmol + $71, 
按 上 节 所 讨论 的 方法 ， 可 以 很 容易 地 算出 所 有 的 主 效应 和 它们 的 交叉 效应 ， 这 些 主 效应 


和 交叉 效应 的 具体 数值 列 于 表 4-8, 
表 4-8 HMMS 2 次 多 因子 主 效应 和 交叉 效应 结果 


aT 估计 效应 因子 估计 效应 ы F 了 估计 效应 BF 估计 效应 
116. 00 ZP 1.38 ZMP 2.25 PDA 0.88 
zp 12.25 ZMD 0.63 
z 20.50 ZA 0.75 ZMA — 2.38 ZMPD — 0.75 
M — 0.63 MP 1.50 ZPD 0. 63 ZMPA 0. 50 
Р —9.18 MD 一 2. 13 ZPA —0.13 ZMDA 1-63 
р 10.25 MA — 0.88 ZDA 0.50 ZPDA 0.13 
A 一 7.00 PD 1.13 MPD — 1.00 MPDA 1.50 
PA 9.18 MPA —3.00 
ZM 213 DA —10.25 MDA 1.63 ZMPDA 0. 00 
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采用 这 些 计算 所 得 的 主 效应 和 交叉 效应 的 数值 ， 吕 得 如 图 4-7 所 示 的 效应 正 态 分 布 图 。 


98.39 31 


Pf 


* i 


-]ó -5 0 5 10 15 20 


图 4-7 МИНЕ 次 全 因子 效应 正 态 分 布 图 


从 图 47 可 以 很 清楚 地 看 出 ， 只 有 A CR 2 ELD, р ОТНЕТ 
PD 和 2Z (硫酸 锌 ) 这 三 个 主因 素 及 ZD 《对 硝 基 芋 基 磷酸 二 钠 和 硫酸 锌 的 交叉 效应 )、DA 
(2- 氨 基 -2- 甲 基 -1- 丙 醇 与 对 硝 基 芋 基 础 酸 二 钠 的 交叉 效应) 才 对 磷酸 酶 活性 有 显著 影响 ,其 他 
别 的 主 效应 和 交叉 效应 都 可 以 忽略 。 这 个 结果 似乎 说 明 对 于 磷酸 酶 活性 的 试验 原本 就 可 只 用 
四 因子 设计 表 来 完成 , 因为 pH 效应 本 身 就 不 显著 ,问题 是 在 实验 前 我 们 没有 这 样 的 把 握 。 但 
Ж. 这 也 从 另 一 面 说 明 25 次 全 因子 可 能 本 身 就 存在 信息 盈余 . 我 们 完全 可 以 想 办 法 来 碱 少 试 


验 的 次 数 。 这 就 是 部 分 


子 设计 的 基本 道理 。 


表 4-7 中 某 些 试验 标记 了 星 花 CÓ. 现在 将 它们 抽出 以 作为 因子 设计 表 ， 并 只 用 它们 来 


进行 主 效应 和 交叉 效应 的 计算 ,这 样 可 以 得 到 如 表 4-9 所 示 的 结果 ,将 得 到 的 效应 下 态 分 布 图 
示 于 图 4-8, 从 图 可 以 看 出 , 所 得 结果 完全 与 2 次 多 因子 效应 正 态 分 布 图 的 结果 一 致 , 说 明 用 
部 分 因子 设计 来 代 赫 全 因子 设计 是 很 有 道理 的 。 
表 4-9 由 表 4-7 中 标记 (=) 的 试验 结果 算得 各 种 效应 值 
因 子 合计 效应 RF иле B + | 估计 效应 因 子 估计 效应 
总 均值 116. 00 D 10.75 ZD ; 9.25 MA —0.28 
z 22.00 A 一 ?75 ZA i —0.25 PD — 1.25 
м —9.80 2м 3.00 MP 2.00 PA 0.75 
P 1.50 2Р 3.00 MD 2.25 DA = 8.90 


将 仔细 讨论 一 下 I :次 半 因 子 设 计 的 基本 原理 及 在 部 分 因子 设计 中 的 十 分 重要 的 概念 。 
用 表 4-7 中 标记 了 星 伦 ( * ) 的 试验 来 组 成 一 个 25- :次 的 半 因 子 设计 表 , 并 用 它们 来 计算 需要 
计算 的 交叉 项 ， 按 前 节 所 讲 的 办 法 ， 将 它们 在 表 中 的 符号 相 乘 ， 根 据 正 正 得 正 、 负 负 得 正和 
正 负 得 负 的 原则 ,计算 出 所 有 交 义 项 的 符号 来 。 表 4-10 中 给 出 了 这 样 计 算 所 得 的 部 分 


结果 。 
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730.0-5.0 0 5.0 10.0 15.0 20.0 
图 4-8 ”23 次 半 因 于 设计 的 效应 正 态 分 布 图 
R410 H2 "次 半 因 于 设计 表 算 得 部 分 主 效应 和 交叉 效应 的 结果 


z MPDA A ZMPD ZM PDA ZA MPD 
= = + + + + m = 
+ + 一 - - 一 一 
一 一 一 一 一 - + + 
+ + + + + + + 
- - - - * * * - 
+ + + + _ _ + T 
- - + + - - - - 
+ + 一 一 + + ~ - 
- - - - + + + + 
+ + + + _ 一 十 + 
- - + + _ - 一 - 
* * - - * + _ _ 
- - + + + + - - 
+ + _ _ _ _ _ - 
- - - - - - * * 
+ + + + + + + + 


AAR 4-10 可 以 看 出 ， 主 效应 Z (硫酸 锌 ) 5 4 项 交叉 效应 MPDA 具有 完全 一 致 的 符号 ; 
主 效应 4 (2- 氮 基 -2- 甲 基 -1- 丙 醇 ) 与 由 项 交叉 效应 ZMPD 也 具有 完全 一 致 的 符号 ; 两 项 交叉 
效应 ZM 与 三 项 交叉 效应 PDA 也 具有 完全 相同 的 符号 等 等 . 这 种 情况 说 明 , 对 于 2 次 半 因 
于 设计 的 效应 将 存在 重复 的 机 会 ， 这 两 种 效应 具有 同一 符号 的 情况 ， 在 部 分 因子 设计 中 ， 统 


计 学 家 将 ] 
EE) 


其 称 为 共 现 现象 ,这 些 同 符号 的 效应 将 称 为 同名 或 别名 效应 。 对 于 用 表 4-7 中 标记 了 
的 试验 来 组 成 的 2 :次 的 半 因 子 设计 表 , 算得 的 所 有 别名 效应 及 其 效应 值 都 列 于 表 


4-11。 从 表 中 还 可 以 看 出 算得 的 别名 效应 一 般 都 发 生 在 主 效应 与 四 项 交叉 效应 及 二 项 交叉 效 
应 与 三 项 交叉 效应 之 间 。 主 效应 与 二 项 交叉 效应 和 三 项 交叉 效应 之 间 不 存在 共 现 现象 。 这 样 
当然 是 比较 理想 的 ， 因 为 一 般 说 来 ， 主 效应 和 二 项 突 叉 效 应 都 比较 重要 ， 在 它们 之 间 发 生 共 
现 现象 就 不 太 好 。 
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RAL 别名 效应 及 其 所 算得 的 效应 值 


я + 估计 效应 W F YT 因 了 uk Bo 情 计 效应 
均 信 +ZMPD4| 116.00 | D+ZMPA 10.95 |ZD+MPA 9.28 | MA-ZPD | —0.25 
Z—MPDA 22.00 | A+ZMPD 7.75 | ZA+MPD -0.25 |rp+zma | —1% 
MtZMDA 一 0.50 | ZM+PDA 3.00 | MP-ZDA 2.00 | FA-EZMD 0.75 
P+ZMDA | 1.50 |ZP+MDA 3.00 | MD ZPA 一 2.25 | DAC ZMP. —8.00 


从 以 上 分 析 可 知 ， 对 于 五 因素 的 全 因子 设计 ， 用 半 因 子 设计 来 蔡 代 ， 可 得 到 与 全 因子 设 
计 上 几乎 相同 的 结果 , 至 此 , 很 自然 地 也 就 产生 了 这 样 的 问题 : 这 样 的 半 因 子 设计 怎 们 构成? 是 
不 是 存在 多 种 构成 半 因 子 设计 的 可 能 ? 如 果 存 在 多 种 可 能 , 怎样 的 半 因子 设计 才 是 最 好 的 ? 在 
以 下 的 讨论 中 将 逐一 来 回答 上 述 问题 。 


二 、 灶 因子 设计 的 产生 方法 及 四 分 之 一 因子 设计 运 


一 个 构成 半 因 子 设计 的 简便 方法 就 是 先 设 定 一 个 同名 和 别名 效应 ， 然 后 就 用 这 个 别名 效 
应 来 产生 别 的 各 个 别名 效应 ， 以 构成 一 个 半 困 子 设计 ， 这 样 设 定 的 别名 效应 就 可 称 之 为 产生 
子 。 现 仍 以 上 述 2 -' 次 的 半 因 子 设计 来 进行 说 明 。 
如 令 效 应 А (2- 氨 基 -2- 甲 基 -1- 丙 醇 ) 与 四 项 交叉 效应 ZMPD AR, WE 
A=ZMPD (4-2) 
这 样 ， 可 得 到 一 个 定义 关系 或 定义 相反 
I-ZMPDX A-ZMPDA (4-3) 
就 利用 式 1-3) 这 个 定义 关系 ,可 产生 所 有 其 他 别 的 各 个 别名 效应 来 。 如 得 到 7 主 效应 的 别 
名 效应 ， 则 可 将 这 个 定义 关系 与 Z 效应 相 乘 而 得 ， 即 
ZXI-ZXZMPDA-Z'MPDA—MPDA (4-4) 
同 至 可 求 得 各 主 效应 的 别名 效应 来 ， 它 们 分 别 为 M—ZPDA; P=ZMDA; D=ZMPA, 对 于 
二 项 交叉 效应 也 可 以 用 上 述 乘 法 原则 计算 ， 例 如 
ZM=ZMXZMPDA=Z'M'PDA=PDA 
别 的 二 项 交叉 效应 亦 可 仿 此 产生 ， 这 样 ， 就 得 到 了 与 表 4-11 完全 相同 的 同名 或 别名 表 ， 
此 外 ， 如 果 定 义 Z 5 MPDA AZ, Wii Zo MPD4. MF Z-MPDA 这 样 定义 的 产生 
子 ， 虽 表 而 上 看 来 与 4 一 ZWMPD 不 同 , 但 实际 上 它们 是 一 样 的 , 这 是 因为 它们 定义 了 同一 个 
定义 关系 T， 即 


I=ZxXMPDA=AXZMPD (4-5) 
所 以 , 由 这 两 个 产生 子 产生 出 来 的 半 因 子 设计 实际 上 是 完全 一 样 的 。 ШЖ, 如 果 定 义 A=2M 
或 4=ZMP, 这 样 就 可 产生 不 同 的 新 半 因 子 设计 ， 但 这 就 造成 了 主因 素 与 二 项 交叉 效应 或 三 
项 交叉 效应 的 同和 名, 从 而 使 得 该 部 分 因子 设计 的 分 辩 率 不 高 , 这 在 下 一 节 将 给 出 较 详细 讨论 ， 
在 此 ， 如 果 令 


A=—ZMPD 
此 时 ， I 二 一 AZMPD， 它 确实 可 以 产生 一 个 与 1 二 AZMPD 不 同 的 半 因 子 设计 ， 而 且 ， 将 这 
岗 个 设计 表 合 在 一 起 , 就 可 成 为 一 个 完整 的 2 全 因子 设计 表 . 注意 考察 表 4-7, MARTIE 
花 部 分 与 没 打 星 花 的 部 分 分 成 两 部 分 ， 则 这 两 部 分 就 恰好 相差 负 号 。 这 在 部 分 因子 设计 中 很 
重要 , 它 构成 部 分 因子 设计 表 可 从 全 因子 设计 表 分 块 而 得 的 基本 思想 。 并且, RABEL, 如 
果 想 用 序 贯 试验 来 进行 试验 设计 、 就 可 先 用 定义 关系 1=4ZMPD 来 进行 第 一 批 试验 ， 然 后 ， 
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根据 试验 结果 看 有 没有 必要 ,再 用 T 一 --4ZWPD 米 进行 下 一 批 试验 , 这 样 就 可 以 做 到 既 能 有 
效 地 利用 部 分 试验 优点 ， 在 必要 时 ， 义 可 得 到 全 因子 试验 设计 所 需 的 全 部 有 用 信息 ?。 

如 前 所 述 ， 当 因子 数 很 多 时 ， 半 因子 设计 的 试验 次 数 仍然 不 少 ， 对 子 在 此 讨论 的 磷酸 艇 
活性 的 实验 , 实际 上 还 可 加 上 一 个 温度 因素 CT), 这 样 , 对 于 全 因子 设计 就 需要 做 64 次 试验 
T, 即使 使 用 半 因 子 设计 仍 有 32 次 试验 数 , 所 以 , 统计 学 家 就 提出 了 一 种 四 分 之 一 部 分 因子 
设计 法 , 在 统计 学 文献 中 也 称 为 2 部 分 因子 设计 法 ,从 而 使 试验 数 仍 保持 为 16 次 。 从 前 述 
的 分 析 中 ,可 以 理解 ， 对 于 四 分 之 一 部 分 因子 设计 法 ， 除 去 原来 半 因 子 设计 已 有 的 同名 效应 
外 ， 还 会 产生 新 的 同名 效应 ， 即 存在 四 个 同名 效应 。 下 面 将 介绍 四 分 之 一 部 分 因子 设计 法 产 
生 方 法 。 首 先 ， 仍 用 半 因 子 设计 的 产生 子 4 一 ZMPDD,， 然 后 再 加 上 一 个 与 温度 (Т) 有 关 的 新 
的 产生 子 , 即 工 一 ZMP。 这 样 , 对 于 四 分 之 一 部 分 因 于 设计 , 这 样 就 得 到 了 两 个 定义 关系 , 即 


I=ZMPDA (4-62) 

和 I=ZMPT ‹4-6Ь) 
第 三 个 定义 关系 可 通过 式 (4-68) MA (4-6Ь) 两 个 定义 关系 相 乘 而 得 

I-ZMPDAXZMPT-Z'M'P'DAT = РАТ (47) 


通过 上 述 三 个 定义 关系 ， 就 可 以 算出 所 有 的 同名 效应 来 ， 如 要 求 ZM 的 同名 效应 时 ， 就 可 以 
用 下 述 三 个 式 于 计算 而 得 


ZM=ZMXZMPDA=PDA (4-8а) 
ZM=ZMXZMPT=PT 《4-8b》 
ZM=ZM XDAT=ZMDAT (4-8 


由 此 算得 的 四 分 之 一 部 分 因子 设计 的 所 有 同名 结果 列 于 表 4-12, 
表 4-12 四 分 之 一 部 分 因子 设计 的 同名 效应 玫 


F 名 效应 
总 平均 = ZMPDA = ZMPT - DAT 
z = MPDA = MPT = ZDAT 
M - ZPDA _ ZPT = MDAT 
P = ZMDA = ZMT = MDAT 
D = ZMPA = ZMPDT - AT 
A - ZMPD - ZMPAT - pr 
ZM = PDA = PT = ZMDAT 
zr - MDA - MT - ZPDAT 
zD = MPA = MPDT - ZAT 
ZA = MPD = MPAT = ZDT 
MP = ZDA = zT = MPDAT 
MD - ЕРА - ЕРОТ = MAT 
MA = ZPD = ZPAT = MDT 
PD = ZMA = ZMDT - PAT 
PA - ZMD - ZMAT - PDT 
DA = ZMP = ZMPDAT = T 


就 像 半 办 子 设计 一 样 ， 四 分 之 一 部 分 因子 设计 也 可 通过 对 全 因子 设计 表 进 行 分 块 后 来 得 

到 不 同 的 但 却 具 有 园 样 分 辩 率 的 部 分 因子 设计 表 ， 而 且 ， 将 它们 合 在 一 起 就 成 为 了 六 因素 全 
因子 设计 表 ， 故 也 可 以 用 于 进行 序 贯 试验 。 它 们 具体 可 由 下 述 不 同 的 定义 关系 来 构成 : 

F=ZMPDA=ZMPT = DAT (4-98) 

1= —ZMPDA- -2МРТ=РАТ (4-9b) 
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I-ZMPDA— —ZMPT — — DAT (4-90) 

1= -2МРрА=2МРТ= -РАТ (4-94) 
由 此 可 见 , 第 一 个 [ 式 (4.9a)] 是 原来 的 四 分 之 一 部 分 因子 设计 , 而 其 余 的 一 个 [ 式 (4-9b) 一 
RUI] 则 是 由 对 第 一 个 设计 的 三 个 定义 关系 中 ， 低 意 改变 两 个 定义 关系 的 符号 而 得 ， 


三 、 因 子 设计 分 辨 率 


因子 设计 的 分 辩 率 是 因 于 试验 设计 中 的 一 个 很 重要 的 概念 一 般 说 来 ， 分 辩 率 越 高 
的 部 分 因子 设计 越 好 。 对 于 我 们 在 上 一 节 讨论 的 2 ' 部 分 因子 设计 ( 即 其 定义 关系 为 1 一 
ZMPDA 的 那个 设计 )， 其 分 辩 率 为 5; 而 对 于 定义 关系 为 1 二 A4ZMP 的 2 部 分 因 于 设 
计 ， 其 分 辩 率 为 4。 从 这 里 我 们 可 以 看 到 ， 定 义 关 系 由 儿 个 因素 组 成 ， 那么， 该 设计 的 分 
办 率 就 是 几 。 值 得 提出 的 是 , 对 于 定义 关系 为 1 一 ZMPDA 的 半 因 子 设 计 , 它 的 主 效应 主 
要 与 四 项 交叉 效应 共 现 ,二 项 交叉 效应 主要 与 三 项 交叉 效应 共 现 ,但 对 于 定义 关系 为 了 一 
ZMPD 的 半 因 子 设 计 , 它 的 主 效应 将 主要 与 三 项 交叉 效应 共 现 ,二 项 交 义 效应 则 与 四 项 交 丸 
效应 共 现 ， 这 样 将 可 能 丢失 一 些 重要 的 三 项 交叉 效应 的 信息 。 因 此 ，: - 般 可 以 认为 ， 三 项 交 
又 效应 要 比 四 项 交叉 效应 更 重要 ， 所 以 ， 分 辨 率 为 5 的 部 分 因 于 设计 要 比分 辨 率 为 4 的 部 分 
因子 设计 好 。 

因子 设计 分 辩 率 的 正式 定义 为 , 设计 的 分 辩 率 为 R 的 部 分 因 于 设计 为 , 在 这 样 的 因子 设 
Y. 无 p 项 交叉 效应 与 (R 一 p》 项 交 义 效应 共 现 现象 的 存在 。 值得 指出 的 是 , 这 一 原始 定 
Ж Boxand ui), 但 现在 有 人 提出 ,此 定义 还 并 不 完善 . 需要 修改 . 有 关 这 方面 的 进一步 
讨论 ， 读 者 可 参看 文献 [6]。 部 分 因子 设计 在 文献 中 的 表述 一 般 为 数字 或 罗马 字 ， 例 如， 对 
于 2 "部 分 因子 设计 的 分 辩 率 可 表示 如 下 ， 

BON SP COND 

上 上 述 符号 就 分 别 表示 分 辩 率 为 5 DAR EUROS £08 2 部 分 因子 设计 ， 

对 于 上 述 给 出 的 分 辩 率 ， 一 般 都 钵 循 以 下 三 条 原则 

中 一 个 具有 分 辩 率 为 3 (R= TO 的 部 分 因子 设计 , 其 主 效应 之 问 不 存在 共 现 现象 , 但 是 ， 
主 效应 一 般 都 与 二 项 交叉 效应 存在 共 现 关 系 。 

@ 一 个 具有 分 辨 率 为 4 (R= N) 的 部 分 因子 设计 ,其 主 效应 之 间 不 存在 共 现 现象 ,同时 
主 效应 与 二 项 交叉 效应 也 不 存在 共 现 现象 ， 但 是 ， 主 效应 一 般 都 与 三 项 交叉 效应 存在 共 现 
关系 。 

9 一 个 具有 分 辨 率 为 5 (R= VO 的 部 分 因子 设计 ,其 主 效应 之 癌 ， 主 效应 与 二 项 交叉 效 
应 及 三 项 充 叉 效应 之 间 不 存在 共 现 现象 ， 但 是 ， 主 效应 与 四 项 交叉 效应 ， 二 项 交叉 效应 与 三 
项 交叉 效应 之 间 却 存 在 着 共 现 关系 。 

一 般 说 来 ， 构 成 一 个 高 分 辩 的 半 因子 设计 的 方法 很 简单 ， 就 是 直 搂 将 最 后 一 个 主 效应 与 
前 面 所 有 因子 的 交叉 效应 构成 一 个 产生 于 ， 以 得 到 一 个 包括 :个 因素 在 内 的 定义 关系 ， 其 余 
因素 的 主 效 应 及 各 项 交叉 效应 可 由 此 产生 。 另 外， 一 般 说 来 ， 对 于 分 辩 素 为 3 的 部 分 因子 设 
计 ， 因 为 主 效应 一 般 都 与 二 项 交叉 效应 存在 着 共 现 现象 ， 所 以 ， 这 样 的 试验 设计 一 般 主要 用 
来 研究 主 效应 ， 此 时 ， 这 样 的 试验 设计 一 般 称 为 饱和 设计 . 

值得 提出 的 是 ， 对 于 因子 设计 的 研究 现在 仍 未 间断 ， 有 人 提出 了 现代 因子 设计 理论 ， 可 
将 任 一 因 予 设计 中 的 主 效应 和 交叉 效应 的 计算 统一 在 一 个 式 子 里 ， 而且 , 对 因子 设计 的 分 块 、 
因子 设计 与 最 优 设 计 的 关系 等 都 进行 了 详细 的 讨论 ， 有 兴趣 的 读者 可 参阅 文献 [7]. 
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ИЯ ” 正 交 试 验 设计 和 正 交 设计 未 
一 、 正 交 试 验 设计 


正 交 试验 设计 从 本 质 上 来 说 .实际 可 以 算 成 是 -种 部 分 因子 设计 方法 ， 因 其 十 要 特征 为 
它 是 基于 正 交 表 来 进行 试验 设计 和 数据 分 析 的 ， 故 有 正 交 试 验 设计 之 称 。 什 么 是 “ 正 交 表 ”? 
在 定 文正 交 表 之 前 ， 有 必要 先 介 绍 “完全 对 ”的 概念 。 
PEA ATER а, cay се, ao B bis bo sO b, WA nm 个 “元 素 对 ” 
(a b) s Cay bi rms Go bs 
(ap sb Gabi em Carb 
(азаб) s Cassi ott a. vba) 


(asb) (asb), Cass bu 
上 述 数 表 为 两 组 元 素 构成 的 “完全 对 "。 如 一 个 矩阵 的 某 两 列 中 , 同行 元 素 所 构成 的 元 素 对 就 
是 一 个 完全 对 ， 如 果 在 此 两 列 中 ， 每 对 出 现 的 次 数 也 相同 ， 则 称 这 两 列 搭配 均衡 ， 否 则 为 拱 
配 不 均衡 。 例 如 ， 下 述 矩阵 的 两 列 搭配 是 均衡 的 : 


1 1 
1 1 
1 2 
1 2 
2 1 
2 1 
2 2 
2 2 
Tü F ЗЕЕ ВО ТЕ. HS i 
1 b 
1 2 
2 1 
2 2 
1 2 
1 2 
2 2 
2 2 


对 子 一 个 GOD MERA, CHB j UIE EDU 1, 2, e, u G=1, Bon m) 所 
构成 ， 如 该 矩阵 的 任意 两 列 都 搭配 均衡 ， 则 称 和 矩阵 4 为 一 个 正 交 表 。 这 里 称 矩 阵 为 表 ， 因 其 
可 将 其 写成 表格 的 形式 ， 常 简 记 为 

Г. Ххх Xim) (4-16) 
1, 是 正 交 表 的 代号 ,来 源 子 拉丁 方 (Latin square) 这 一 试验 设计 表 的 第 一 个 字母 ,表示 共 作 n 
REM, JH 1 250) CR ИН, 个 水 平 组 成 。 如 所 有 4 均 相 等 , 则 可 记 为 
L.G) , 称 为 KEELE. 如 两 列 水 平 数 不 相 等 时 , 则 称 为 混合 型 正 交 表 。 用 正 交 表 来 安排 试 
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3 RT ELI В 7] B a К С Ж ЖЕ ЭСЕЛЕ Hi I HE AK SECURUS BE ЛУ RU B „Н Ж 
正 交 试验 的 理论 分 析 , 读 者 可 参阅 文献 [85]。 正 交 试 验 的 理论 分 析 可 以 说 明 , 从 各 种 角度 与 标准 
衡量 , 正 交 设计 都 是 一 种 最 优 设计 ， 下 面 主要 对 如 何 使 用 正 交 设计 表 作 量具 体 说 明 。 


二 、 正 交 表 及 其 交互 效应 胡 


对 于 每 一 张 正 交 表 ， 痢 有 一 张 两 列 闻 的 交互 效应 表 与 之 对 应 ， 如 工 ，(2') 的 两 列 间 交互 
效应 表 为 表 1-13. 
#413 1,(27) 的 两 列 间 交 互 效应 胡 


列 5 1 2 3 4 5 6 7 
~ o 3 E 5 í 7 $ 

[CH 1 8 7 4 5 

e 7 5 5 4 

a 1 2 3 

©) 3 2 

1 

7 


o 


从 袁 中 可 查 出 第 一 列 〈1) 与 第 2 列 (由 (1 所 在 行 从 左 向 右 模 向 找到 2) 的 交互 效应 是 第 
3 列 , 与 第 4 列 的 交互 效应 是 第 5 列 , ……, 如 此 等 等 , 可 在 表 中 找 出 任 一 列 的 交互 效应 列 米 。 
下 面 以 一 个 简单 的 例子 来 加 以 说 明 怎 样 来 用 正 交点 进行 试验 设计 和 数据 分 析 。 

设 有 一 化 学 反应 , 需 考察 四 个 实验 条 件 的 影响 : CD 反应 温度 (А); O 反应 时 间 B; Э 
RAHME (O; Ф 反应 压力 D, 并 设 各 条 件 均 是 两 水 平 。4 的 两 个 水 平 为 : 60°C 与 80°C: 
В 的 两 个 水 平 为 : 2. 5h 与 3. 5h; C 的 两 个 水 平 为 : 1. 1/1 和 1. 271; D 的 两 个 水 平 为 : 6. 7X 
10'Pa 和 8.CX10'Pa.。 如 想 只 做 8 次 试验 , HTAR LOOR (SLE 4-14) 来 安排 试验 , 从 
表 中 可 以 看 出 , 正 交 表 的 每 两 列 者 是 搭配 均衡 的 。 因 这 个 试验 主要 想 考察 4 (反应 温度 ) 与 8 
(反应 时 间 )、4 (反应 温度 ) УС (RMR RB RMA SC (反应 物 配 比 ) 的 交 
XUL. 根据 Ls(2") 表 和 其 交互 效应 表 (参见 表 4-13), 可 将 4 因素 定 在 Le(2”) 表 的 第 一 列 ， 
B 因素 定 在 Ls(2") 表 的 第 二 列 。 从 Lst2') 的 交互 效应 表 知 ， 第 1 列 与 第 2 列 的 交叉 效应 在 第 
3 列 , 将 其 空 出 , W C 因素 定 在 第 4 列 , 表 由 交互 效应 表 知 . 第 1 列 与 第 4 列 的 交互 效应 在 第 
5 列 , 故 也 需 将 第 5 列 空 出 , 在 根据 交互 效应 表 找 出 因素 与 C 因素 的 交互 效应 列 , 即 第 2 列 
与 第 4 列 的 交互 效应 列 ， 从 交互 效应 表 可 找 出 它们 的 交互 效应 列 是 第 6 列 ， 也 将 其 空 出 于 
是 ，D 因素 就 定 在 第 7 列 了 。 


жам Li(27 正 交 试 验 表 ” 


试验 号 一 ns 1 z E 4 5 6 7 
1 1 1 1 1 1 1 1 
2 1 1 1 2 z z 2 
3 1 2 2 1 1 2 2 
4 1 z 2 2 2 1 1 
5 2 1 2 1 2 1 2 
6 2 1 2 2 1 2 1 
7 2 2 1 1 2 z 1 
8 2 2 1 2 1 1 2 


团 在 此 表 中 将 上 一 节 所 用 的 负 半 用 1 来 代替 了 ， 而 正 号 则 用 2 KRET. ЛАИН ЕЕГ E£ K. 
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按 这 样 定 下 各 因素 列 号 后 ,就 可 根据 LOI kR HEP RRM MAR. 
然后 对 各 交叉 项 效应 进行 估价 。 因 为 在 Le(27) 正 交 表 中 就 可 得 到 各 交叉 项 效应 的 符号 〈1 为 
正 ，2 为 负 )， 采 用 上 节 所 述 方法 ， 容 易 估价 出 我 们 所 感 兴趣 的 交叉 项 效应 米 ， 问 样 ， 还 可 以 
用 上 节 所 述 的 效应 正 态 分 布 图 来 对 它们 进行 显著 性 估价 。 


三 、 正 交 设 计 表 的 线性 图 及 应 用 


对 于 正 交 设计 的 试验 安排 ， 除 交互 效应 表 外 ， 还 有 一 个 很 重要 的 工具 是 正 交 设计 表 的 线 
性 图 ， 这 一 节 我 们 将 对 此 作出 较 详细 的 介绍 。 

对 于 不 同 的 正 交 表 ， 都 存在 其 相应 的 标准 线性 图 。 对 [at2 ) 正 交 表 来 说 ， 其 标准 线性 图 
如 图 4-9 所 示 。 下 面 以 此 来 对 正 交 表 的 线性 图 的 使 用 加 以 说 明 。 


1 
n 3 
PAS а 
Uu le— 
oS, ` 
2 6 4 


ч) 


图 4-9 L:(2) 正 交 表 的 标准 线性 图 


由 图 4-9 所 示 的 L,《2") 正 交 表 的 两 个 标准 线性 图 包括 以 下 信息 : 

线性 图 (a); 图 中 的 点 及 其 相应 的 数码 代表 Lv(27) 正 交 表 的 列 ， 图 中 的 连 线 及 其 相 
应 的 数码 也 代表 Ls(2') 正 交 表 中 的 某 一 列 ， 只 是 这 样 的 列 是 表示 其 线条 相连 的 两 个 点 所 
代表 的 两 列 的 交互 效应 ,从 图 4-9 GO EUR 8], 该 图 有 4 个 顶点 ， 即 点 1、2、4、7， 其 中 
1. 2. 4 点 有 线 相 连 , 而 7 点 为 一 孤立 点 。 这 就 说 明 , 在 Le(2) 正 交 表 中 , 第 1 列 与 第 2 列 
的 交互 效应 列 是 第 3 列 ， 第 1 列 与 第 4 列 的 交互 效应 列 是 第 5 列 ， 第 2 列 与 第 4 列 的 交 
互 效应 列 是 第 OF. BEAMS, MBE Li(27) 正 交 表 中 不 存在 与 第 7 列 有 交互 效应 
的 列 。 从 上 述 讨 论 可 知 ， 线 性 图 的 顶点 所 对 应 的 列 ， 可 用 于 安排 试验 的 各 个 因素 ， 如 对 
于 上 节 所 讨论 的 一 个 四 因素 试验 ,就 可 将 它们 安排 在 顶点 1、2、4、? 所 对 应 的 Ls(2 TE 
交 表 的 列 之 上 ， 对 那些 需要 调查 交互 效应 的 央 素 发 尽量 安排 在 贰 点 1、2、4 之 上 ， 这 与 
上 节 所 介绍 的 方法 是 一 致 的 。 

线性 图 (O: 图 中 顶点 和 连 线 的 实际 意义 同 线性 图 (a)， 顶 点 为 1、2、4、7, 为 一 不 同 
之 点 是 ， 在 这 种 试验 设计 的 方案 中 ， 是 以 Le(27) 正 交 表 中 的 第 1 列 为 中 心 ， 交 叉 效 应 将 只 考 
虑 第 1 顶点 与 第 2. 第 4 和 第 7 WAZA, BL) ERR POS ] 列 与 第 2 列 、 第 1 列 与 
第 4 列 ,第 1 列 与 第 7 列 的 交叉 效应 。 所 以 , 在 安排 试验 时 , 将 各 个 因素 安排 在 顶点 1、2、 人 + 
7 之 上 ， 而 且 ， 第 1 点 的 选择 特别 重要 。 

上 述 两 种 正 交 设计 的 线性 图 都 可 从 交互 效应 表 中 导出 ， 对 照 交 互 效应 表 ， 都 可 找到 它们 
的 可 能 组 合 。 所 以 ， 正 交 表 的 线性 图 与 交互 效应 表 是 - 致 的 ， 只 不 过 线性 图 使 用 起 来 更 为 方 
EZT. 


四 、 常 用 正 交 表 及 根 应 的 交互 效应 表 与 线性 图 


3 4-15 给 出 了 一 些 常用 的 正 交 表 , 相应 交互 效应 表 和 线性 图 (Common used Orthogonal 
Arrays, their interaction tables and their linear graphs), 以 备 读者 查 用 。 对 给 出 这 些 表格 . 在 
此 作出 几 点 相应 说 明 。 
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(D 正 交 表 常 记 为 
L,G; Xt) Xt X tt Xt) 

LEERRARS, RMFRT (Latin square) 这 一 试验 设计 表 的 第 一 个 字母 ; n 表示 共 
fE n ERM, mis, G51, 2, +, m) 则 代表 第 了 列 由 记 个 水 平 组 成 。 如 所 有 г, 均 相等 ， 则 
可 记 为 Lp?， 称 为 上 水平 正 交 表 。 如 两 列 水 平 数 不 相等 ， 则 称 为 泥 合 型 正 交 表 ， 记 为 
LG X85. M Ls(' x Dg iab VOUS 32, А-КЕ BUS 2. 5 9 列 的 水 平 数 
为 4 的 正 交 设计 表 。 

回 利用 交互 效应 表 ， 可 方便 进行 交互 效应 估计 

图 在 正 交 表 中 , 不同 的 列 可 分 成 不 同 的 组 ， 以 方便 运用 线性 图 进行 交互 效应 估计 ， 根 据 
不 同 组 的 列 ， 运 用 线性 图 即 可 方便 组 织 试验 。 


#415 正 交 试验 表 汇 集 
G) L.ODIESERUE S 


"Ta |! : 3 
1 1 1 1 L 线性 图 
2 1 2 2 123 
3 E 1 2 +e 
4 2 2 1 
+ + + 
Q4 9-8 +. 第 二 组 。 
(2) LG E ZERO eO 
wee AS Jj 2 3 4 5 6? ui +: 
1 1 1 1 1 1 11 " 
2 1 1 12 2 2 2 |, ZŠ 5 HT 6 Mi 
3 1 2 2 1 1 2 2 К M РА 
4 1222211 ? в 4 
5 2 1 2 1 2 1 2 O (2) 
4 2 1 2 2 1 2 1 
? 2 2 1 1 2 2 1 
8 2 2 1 2 1 1 2 
+ + + v ç v V 
: 第 一 组 : 多: 5 o, v. mc. 
(2а) Улыгыз 表 
列 号 1 2 3 4 s 6 7 
a 3 2 5 4 7 E 
0) 1 6 7 4 5 
G 7 6 5 4 
a» 1 2 a 
(5) 3 2 
(6) 1 
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(3) Lizt29) 正 交 试 验 表 


11 


10 


试验 号 


10 
п 
12 


二 组 。 


O+: 第 一 组 ;$1 第 


因为 此 正人 交 表 的 第 二 组 10 ASEM ER” (confounded), AVA, MAMET ARR ARM RRB Р. 


(4) L, 09) EXER EO 


2 


列 号 


试验 号 


10 
11 


12 
13 
14 
15 
16 


f, v. Baw es. BOA. 


(42). Las 215) fA] P P| [RT ЖЕ 8 ЖЫ Ж 


оа. 第 一 组 ; +, 第 


列 号 


а) 


@у 


10 
13 
12 


п 


(3) 


12 
13 


ч) 


10 


(5) 


(6) 
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Er 
pi 1 2 3 5 7 8 E] юп и 18 м 1 
7 (C 18 H 1i 2 H 10 9 8 
(8) 1 2 3 4 з 6 T 
©) a 2 5 а 7 6 
aao 1 & 7 4 5 
ap 7 6 8 4 
an ài 2 3 
as a 2 
aod 
La 部 分 线性 图 


(5) LGO F ORE RE? 


ию B9 | 1 2 3 í umu we | | 2 3 4 
1 Т 1 1 1 1 6 7 2 3 1 z 
2 1 2 2 2 T 3 1 3 z 
3 1 3 3 3 B 3 2 1 3 
4 2 1 2 3 4 3 a 2 | 
5 2 2 3 1 + + * + 
@ 4: 第 -组 : Ф. 第 二 组 。 
L, RHEE 
1 34 2 
* -+ 
(6) Le X37)1F RRR? 
uns p» 1 2 3 5 6 7 8 
1 1 1 1 1 1 1 1 1 
2 1 1 2 2 2 2 2 2 
3 1 1 3 3 3 3 3 3 
4 1 z 1 1 z 2 3 3 
5 1 z z 2 3 3 1 1 
6 1 2 3 3 1 1 2 z 
7 1 3 1 2 1 3 2 3 
8 1 3 2 3 2 1 3 i 
9 1 3 3 1 3 2 1 2 
16 2 1 1 3 3 2 2 1 
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EI 


11 


17 
18 


# €. BoA. PL, BARR “R” (confounded)， 此 表 最 好 不 要 用 有 交叉 项 效 


Qa: 第 -- 组 ; +. 第 


应 的 试验 设计 。 


LAS 


C La GU ERR 


E 


试验 号 


10 
п 


12 
13 
14 
15 
16 
17 
18 
19 
20 


21 


22 
23 


24 
25 


26 


27 
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(7а) L, (2388 PERI a] 3e 8 ЖМ BE 


я 号 1 z 3 4 5 6 8 9 м NH 2 1 
@ s 3 2 6 5 9 8 8 12 n 1 
4 4 3 T 7 10 10 9 13 B 12 
@ 1 1 8 s $5 6 7 8 6 £7 
4 3 dH 12 пио зов 9 W 
(3 1 9 10 7 5 6 6 7 5 
z 13 11 12 13 11 10 8 a 
4) 10 8 6 7 5 7 5 5 
12 13 13 11 12 9 10 LI 
G a 2 3 4 2 4 3 
了 11 13 12 В 10 9 
(6) 4 2 3 3 2 4 
Š 13 12 п 10 9 8 
o 3 4 2 4 3 2 
gon oa 9 85 13 
@ 1 1 2 3 4 
10 9 5 7 6 
9 1 4 2 8 
8 7 6 5 
ao 3 4 2 
6 5 7 
ap 1 1 
B и 
аз 1 
1i 
Ls 部 分 线性 图 
9 wR D 
veer 
Dod 
Sez 
vs 
fele 
(8) Ly (4 ESRB 
xS СБА 1 2 3 4 Hmm ns 1 2 3 4 5 
1 1 1 1 1 | 9 3 1 3 4 2 
2 1 2 2 2 2 10 3 z 4 3 1 
3 1 3 8 3 8 и з 3 1 2 4 
4 1 4 4 4 4 12 3 4 2 1 3 
5 2 1 2 3 4 13 4 1 4 2 3 
6 2 2 1 4 3 nu 4 2 3 1 4 
7 z 3 4 1 z 15 4 3 2 4 1 
8 2 4 3 2 1 16 4 4 1 3 2 
5+ + + + 
Ls 线性 图 
2 
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10 


à + V ç ç ç vv í vyv Ç 


18 
19 


20 
zi 


22 


23 
24 


29 
26 
27 
28 
29 
30 
31 
32 


1 
2 


试验 号 


10 
1 


12 
13 
14 
15 
16 
17 


ФФ: 
应 的 试验 设计 。 


. Elan BARA “IR” confounded), MAAR AA RRA 


ni 


dB, Ф: 第 


LES TEES 


Lss 线 性 图 


(10) Le (4 EER E 


H |M sss емен асно mean sonn mam өтпө 
g -ums оно асте ече өчесе өсте жеее 
m |nume oe A Aem oco no M oo c mor 
wolle mnn se mos ome mec nos 
mese menu rene ammo veu novo osos 
oe mue wA mom mue money iom 
a | ame mann smana nove soe sss mom 
Z | sss een ouem nma отсе mmo 
monem me] етее ese me meon mos 
s [asss mace nana eese ovo чет тее 
= [=s ss sec m тшше omen seen эмет FON 
2 | eee sou coros e ns Ad MAI mourn 
o (anos name nams caine tann soam 65 
a [anes nans nans nans mena mana өчем 
o Гало аген mame чөе aime чоме есте 
o janes nans name очон HaT оет пее 
e [emen sans enne ru mm ANAS 
[nene sess neon rus nnno тее эбеп 
e danno sema mano tome чава mnnr eem 
a anan sess menm c neo msn noon 
jenen uuum mene ae чече sas мее 
[^J 

Ej |-=e< oce sany пда паз ЫМА SASS 


试验 号 
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BR 


ЕЕЕ 


wan 


EET 


enm omm 


DESEE 


+m 


“= 


Sm ea s e 


murem 


ож 


"^uo uc 


== 


езет eo ea ea ea ca 


СЕКЕ 


ЕСУ 


oman uoo 


m0 


anne 


NNN w 


as Gee 


comen om 


29 


30 


31 


32 


33 
34 
35 
36 


37 


38 
39 
40 
Al 


42 
43 


44 
45 
46 
47 
48 


49 
50 


51 


52 
53 
54 
55 
56 
57 


КЕЕ 


ЕТЕ 


+= 


MA we 
Mu om 
сеем 


et чен а 
басир a he 


== a wma 
out ono m 
ot omi nds 


mem mm 


Á—— 9 


memi 


386 


2 组 


21 


20 


кою 


езшш 


7 
п 
15 


7 8 9 6 
il 12 13 10 
19 20 21 14 


6 
10 
18 


9 
u 
21 


8 
16 
19 20 


15 


5 


14 
18 


11 12 13 
15 16 17 
19 20 21 


10 
14 
18 


1 
3 
4 


9 6 7 9 8 
12 11 10 12 13 
18 21 20 15 14 


8 
13 
19 


г 7 6 9 8 
15 17 18 15 14i 
18 20 21 18 15 


13 
m 
19 


10 
17 
20 


11 
16 
21 


4 


3 


58 
99 
60 
61 
62 
63 
64 


(11DLa(4") 的 两 列 间 交 互 效应 表 
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зж 
— 
1 5 7 8 9 10 11 12 13 M 15 16 17 18 19 20 
"m 8 20 21 
H H 3 2 5 4 5 2 4 3 4 2 3 5 
D 6 6 17 15 M 16 12 1) 13 10 13 ] 10 12 
3 8 20 19 21 18 21 19 18 20 16 18 17 M 
1 4 5 2 3 3 4 2 5 5 3 2 4 
(8) 6 15 17 16 14 13 10 12 11 U 13 12 10 
7 11 18 20 19 19 21 20 18 17 М 18 15 
5 4 3 z 4 3 5 z 3 5 4 2 
(9) 16 l4 15 17 11 12 10 18 12 10 11 13 
19 20 18 21 20 18 19 21 15 16 14 17 
1 1 1 z 4 5 3 2 5 3 4 
a0 12 H ll 6 8 9 7 6 9 7 8 
13 13 12 18 21 19 20 М 16 17 15 
H 1 4 2 3 5 5 2 a 3 
ay 06 10 8 7 6 8 8 7 9 6 
13 12 20 19 21 18 17 15 14 16 
1 5 3 2 4 3 4 2 5 
9010 7 9 8 6 9 6 B 7 
11 21 18 20 19 18 17 16 14 
3 5 4 2 4 3 5 2 
aD 8 6 7 9 7 8 6 9 
19 20 18 21 16 14 13 17 
1 1 1 2 3 4 5 
D 16 15 1$ 6 8 3 7 
17 17 16 10 13 11 12 
l 1 3 2 5 4 
a5) 14 14 9 7 6 8 
17 16 12 11 13 10 
1 4 5 2 3 
0 14 7 9 8 6 
15 13 10 12 1 
5 4 3 2 
ap 8 6 7 9 
п 12 10 13 
1 1 1 
(18) 20 19 19 
non 20 
1 1 
《19) 18 18 
21 20 
1 
(20) 18 
19 
Lae RB 
34,5 1192021 
+—_ vla 
ME: 
6 ЫЛЫП 
10 
; яп фо 9n 
DAS 
B VE wis vió #17 
2 3 фію 90 ө? 


10,14,18 
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2) Lx (5°) TE 3 639 E 


mm 9 1 2 3 4 5 6 |a o 01 2 3 4 5 58 
1 1 1 1 1 1 ! 11 3 4 1 3 5 2 
2 1 2 2 2 2 z 15 3 5 2 4 1 8 
3 1 3 3 3 3 3 16 4 1 4 2 5 3 
4 1 4 4 4 4 4 р 4 2 5 3 1 4 
5 1 5 5 5 5 5 18 [6 š 1 45 ? 5 
6 2 1 2 3 4 54 19 a4 2 5 3 1 
7 2 2 8 4 5 1] 20 [а § 3 1 4 2 
8 2 3 4 5 1 2 21 5 1 5 4 3 2 
ЕД 2 4 5 1 z 3 22 5 z 1 5 4 3 
10 2 5 1 2 3 4 23 5 3 2 1 5 4 
u 3 1 8 5 2 4 E 5 4 3 2 1 5 
12 3 2 4 1 3 5 25 5 5 4 3 2 1 
13 3 3 5 2 4 i + + + + + + 
线性 图 


1 3,4,5,6 
D 


第 五 节 ”均匀 试 验 设计 及 均匀 设计 表 


部 分 因子 设计 和 正 交 设计 均 可 显著 地 减少 实验 次 数 又 不 丢失 实验 信息 ， 是 很 好 的 实验 设 
计 方 法 , 凡 十 年 来 在 工业 生产 和 科学 研究 中 得 到 了 相当 广泛 的 频 用, 其 中 特别 是 正 交 设计 , 由 
于 正 交 表 还 具有 搭配 均衡 的 性 质 ， 故 还 有 所 谓 的 “均匀 分 艇 整齐 可 比 ” 的 优点 。 然 而 ， 每 
一 种 方法 都 有 其 局 限 性 ， 部 分 因子 设计 和 正 交 设计 也 不 例外 ， 它 们 只 宣 用 于 水 平 数 不 多 的 实 
验 中 , 若 在 -~ 项 试验 中 有 * 个 因素 , 每 个 因素 各 有 а 个 水 平 , PERMA, 则 至 少 要 
ЖЕ а АЮ, 例如 ,如 果 我 们 取 10 个 水 平 ， 则 项 至 少 做 100 次 试验 ! 值得 提出 的 是 , 在 化 学 
与 化 工 的 生产 与 科研 的 实际 中 ， 很 多 变量 ， 如 温度 、 压 力 、 少 度 等 都 是 连续 变量 ， 水 平 数 取 
太 少 有 时 很 礁 反 映 实 际 情况 ， 似 乎 有 另 贬 新 径 的 必要 。 

所 有 的 实验 设计 方法 本 质 上 就 是 在 试验 的 范围 内 给 出 挑选 代表 点 的 方法 ， 均 匀 设 计 就 是 
一 种 着 重 在 试验 范围 内 考虑 试验 点 均匀 散布 以 获得 最 多 试验 信息 的 较 新 的 试验 设计 方法 
其 对 于 具有 较 多 水 平 的 试验 安排 尤为 有 用 。 均 匀 设 计 由 我 国学 者 方 开 泰 、 王 元 提出 ， 现 已 得 
到 广泛 应 用 。 

均匀 设计 与 正 交 设计 相似 ， 也 是 通过 一 套 精心 设计 的 表 来 进行 实验 设计 的 ， 对 于 每 一 个 
SAAHA, 也 同时 给 出 了 一 个 使 用 表 ， 它 可 指示 我 们 如 何 从 均匀 设 这 表 中 选用 适当 的 列 来 
安排 试验 ， 以 便 使 读者 对 均匀 设计 的 基本 思路 和 基本 原理 有 一 个 整体 概念 。 


一 、 ЮЗА НИЕ 


均 句 设计 表 定 义 : E-THURHRE-THE, BRA n fim PI, -NE 41, 
2, +, п} 的 一 个 置换 即 1，2，…， n ЕЙЕЛ). RAVE (1, 2, n n) 的 一 
个 子 集 ， 但 不 一 定 是 真 于 集 。 

与 正 交 试 验 表 类 似 ,均匀 设计 表 一 般 都 用 U. C е, 其 中 ”表示 试验 的 次 数 ,* Жол 
试验 的 因素 数目 , 9 表示 试验 的 水 平 数 , 表 4-16 给 出 了 一 个 7 次 试验 , ? 水 平 4 因素 的 均匀 实 
验 设计 表 。 


ж 416 VODA 581 R 


试验 号 ДЕ 2 3 ^ [ums — 9 | 1 2 3 4 
3 1 2 
5 4 1 
7 7 7 


ME 4-16 可 以 看 出 , 对 于 T 水 平 的 实验 设计 ， 只 需 安 排 7 次 试验 就 够 了 . 但 符合 上 述 定 
义 的 均匀 设计 表 很 多 ， 在 此 仅 介绍 好 格子 点 法 构造 的 均匀 设计 表 ， 其 方法 如 下 
(D 给 定 试验 数 >， 寻 找 比 = 小 的 整数 靖 ， 且 使 = 和 的 最 大 公约 数 为 1 MER), FA 
这 些 条 件 的 正 整 数组 成 一 个 向 量 А Ch, han shine 
Q 均匀 设计 表 的 第 7 列 生成 ”由 下 述 步 又 生成 : 
w=ih, (mod n] 
AP, [mod a] 表示 同 余 运算 〈 即 对 n 取 余 数 )。w, 可 以 递 推 来 生成 
uu, 
DEUM (uy HA; Kn) 
^ ZEN (ao hon) 


. i=1, 2, c, n—1 
Bii, 3 a—9 时 , GOB ЛЖ 1,2,4, 5. 7, 8, f h=33Ñ h=6, 因为 都 与 9 不 
互 质 而 不 符合 条 件 中 。 所 以 ，Us 表 最 多 只 可 能 有 6 列 。 又 如 当 加 一 4 at, AERA ROR 
生成 该 列 时 ， 其 结果 依次 如 下 : 
154, un7—4 4, u5—87T4—712—3 (mod $) 
w= 3t4=7, z | =7+4=11=2 (той 9), 
na =2+4=6, u=6+4=10=1 (mod 9), 
из==1+4=5, иӊ=5+4=9 
其 结果 列 于 表 4-17 的 第 三 列 。 


Жалт Us MARTE 


wm 
ona w 
о = = = 
ema © 


用 上 述 步骤 生成 的 均匀 设计 表 记 作 U, q), AE BRERA. 有 时 为 了 强调 
& 的 作用 , 可 将 UGER U.W. 给 定 n, 相应 的 严 可 以 像 上 例 那 样 方便 地 求 得 , АЛ m tB 
就 确定 。m 实际 上 是 n 的 函数 。 这 个 函数 曾 由 数学 家 欧 拉 研 究 过 , RHR, 记 为 EECn)。 
这 个 函数 告诉 我 们 均匀 设计 表 最 多 可 能 有 多 少 列 。 下 面 的 结果 来 自 数论 ， 

(1) 当 为 素数 时 ,FE(n 一 1) 二 n 一 1。 所 谓 素 数 就 是 一 个 正 整数 , 它 与 其 他 所 有 比 它 小 的 
正 整 数 互 质 ， 即 最 大 公约 数 为 1， 如 2，3，5，7，11]，13，"…， 均 为 素数 。 

(2) 当 RATE, De RRM пр", RB p I m 为 正 整数 ， 这 时 
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EG) =al i=] (1) 
Bil л=9, WRH n=, TE 
E(Q)=9 1-4] =6 


BD Us 至 多 可 以 有 8 列 。 
O 若 ” 不 属于 上 述 两 种 情况 Re 一 定 可 以 表示 为 不 同 素数 的 方 宕 积 。 即 


n= pg p нер” (4-12) 
这 里 pis pe pe c р, AARRE ml. m2, +, ms 为 正和 整数 。 这 时 
| lj 
Emsi) [17 z]7 11-2 (4-13) 
例如 ”一 12 PRA n= х3, TÉ 
EQ2)—12|1— +] [i-i i-a 


即 Ui 至 多 可 以 有 4 列 。 
上 述 三 种 情况 中 ， 以 素数 情况 为 最 好 ， 最 多 可 能 获得 (x 一 1) 列 。 而 非 素数 情况 ， 在 上 
述 表 的 结构 中 水 远 不 可 能 有 (x 1) 列 。 例如 wn 一 6=2X3, 此 时 EE (6) =6 


[i75] i- 4| ez 这 说 明 ， 当 6 时 ， 用 上 述 办 法 生成 的 均匀 设计 表 只 有 2 列 ， 即 最 多 


只 能 安排 两 个 因素 ， 这 是 太 少 了 ,为 此 ， 王 元 、 方 开 泰 建议， 可 将 U;(75) 表 的 最 后 一 行 去 
掉 来 构造 U;, 为 了 区 别 由 上 述 方法 生成 的 均匀 设计 表 ， 他 们 把 这 些 表 记 为 U QUO. 在 UU 的 
右上 角 加 上 一 个 “*” 号 。 表 Ui (6) 列 于 表 4-18. 是 由 表 U? (7") 去 掉 最 后 一 行 而 得 。 注意， 
由 这 样 的 方法 构造 出 来 的 U RU 表 之 间 存 在 如 下 关系 和 特点 : 

© 所 有 的 U; 表 是 由 U, 表 划 去 最 后 一 行 而 获得 。 

QU 表 的 最 后 一 行 全 部 由 水 平 HR. U; 表 的 最 后 一 行 则 不 然 ， 若 每 个 因素 的 水 平 都 
是 由 低 到 高 排列 ，U* 表 的 最 后 一 行 所 对 应 的 试验 将 全 部 由 最 高 水 平 组 合 ，U* 表 则 没有 类 似 
现象 ， 比 较 容易 安排 试验 。 

© E п ABM, Ul REU, 表 有 更 多 的 列 。 如 上 面 讨论 的 Us 只 有 两 列 ， 而 Us 可 以 有 
6 列 。 

D Hn HAR WU; 表 的 列 数 通常 少 于 U, 表 。 

OU! REU, 表 有 更 好 的 均匀 性 ， 应 优先 采用 ， 细 节 将 在 下 节 讨 论 。 


O 若 将 U, desk Ur 表 的 元 素 组 成 一 个 抵 隆 的 铁 最 多 分 别 为 王 Co ET D Li, 


R418 Uç (6") 均 匀 设计 家 


wes 列 号 1 2 3 4 3 9 | We 1 2 8 4 5 6 
1 1 2 3 + 5 6 4 4 1 5 2 6 3 
2 2 4 6 1 3 5 5 5 3 1 6 4 2 
3 3 6 2 3 1 4 6 $ 5 4 3 2 1 


二 、 均 匀 性 准则 和 使 用 表 的 产生 
在 均匀 设计 中 ， 除 给 出 的 均匀 设计 表 以 外 ， 还 有 一 个 使 用 表 ， 根 据 此 表 ， 可 以 作出 一 些 
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选择 ， 即 可 选 出 对 应 的 询 来 表达 试验 中 的 因素 。 如 要 从 均匀 设计 表 UF aR U, Gn) hik B 
s 列 ， 则 可 能 有 C 种 可 能 ， 若 要 从 中 选择 一 个 最 好 的 ， 这 里 必须 对 “好 ”和 “ 坏 ” 有 明确 的 
S X. Us" 是 由 它 的 生成 向 量 А (do hn) SPE SE BU, 选择 s p|, 本 质 上 就 是 从 中 
选择 * 个 元 素 。 并 由 它们 来 产生 一 个 新 的 xXs 矩阵 ， 以 构成 一 个 新 的 均匀 设计 表 U, Uns 
和 ), 它 的 每 一 行 是 维 空间 R 的 一 个 点 ,车 这 个 点 在 试验 范围 内 均匀 分 布 , 则 试验 效果 好 ， 
否则 试验 效果 不 好 。 比 较 两 个 可 能 的 均匀 设计 表 U, 的 好 坏 等 价 于 比较 对 应 两 组 点 集 在 试验 
空间 的 均匀 性 。 于 是 ， 必 须 给 出 均匀 性 的 度量 。 

度量 均匀 性 的 准则 很 多 ， 共 中 偏差 是 使 用 历史 最 久 ， 为 公众 所 广泛 接受 的 准则 。 下 面 将 
给 出 它 的 定义 。 

设 U,(n") 是 一 个 均匀 设计 表 , 车 把 它 的 每 一 行 看 成 wr 维 空间 的 一 个 点 , 则 U,n") 给 出 了 
个 试验 点 ,这 些 点 的 坐标 由 {1,2,…,n} 组 成 。 用 线性 变换 将 并 ,2,…,n) 均 匀 地 变 到 (0、1) 
之 间 如 下 ， 


i-*(2i--1)/C2n) i=1,2, on (4-14) 

若 用 qa OR U,《n") 中 的 元 素 ， 则 上 面 的 变换 等 价 于 令 
ды (q —1)/(2n) (=1,2,w,mi R= Zon (4-15a) 
XQ— (Ti s Eers" Zam) &—1,2, n (4-15b) 


THÉ. n Ari AEROS =C hf RR xoxo Æ C" 的 均匀 性 。 

偏差 定义 хо xo сз, xA C" 的 个 点 , 任 一 向 量 xm Gc metn ЄС" 的 ， 记 
va) Xa X Xa 为 矩形 [0, x] 的 体积 ,nz AE ex 中 落 人 矩形 [0, x] 的 点 数 ， 
则 

DG x77 5 ¥,) =sup ln,/n—v (x) | (4-16) 
єс" 

BARR ns xe => x) 在 C" 中 的 偏差 。 

a ft 2 di 28 9] VA RI TE я REHE? En 个 点 ху, ху, o x, ТЕС" 中 散布 均 
5], MJ w/z # 8 A НИ ABE ГО, х], u 34 3056 IEEE Kin. 如 
果 用 统计 学 的 语言 来 解释 偏差 ， 令 


F.G)=|[ 51162 ]/n (17) 
£ 


表示 Un. xe "5 x.) BERSHKA, ХОН. 1 CO 为 示 性 函数 。 令 FOA C 上 均匀 分 
布 的 分 布 函 数 ， 于 是 上 述 定义 的 偏差 可 表 为 
DG оху Kn) ==вир|Ё„(х)— FG) (4-18) 
x€ C” 
偏差 实际 上 就 是 在 分 布 拟 合 检验 中 的 Kolmogorov-Smirrov 统计 量 ， 它 给 出 了 经 验 和 理论 分 
布 之 问 的 偏差 。 

EC CREB n EOS хо се, 如 何 计算 它们 的 偏差 对 均匀 设计 表 的 构造 十 分 重要 。 
长 期 以 来 、 一 直 没 有 人 提出 一 个 实用 的 算法 。 方 开 泰 等 是 把 偏差 展开 成 级 数 ， 取 其 首 项 ， 给 
出 近似 仿 差 的 准则 。 此 法 计算 方便 ， 但 有 时 误差 较 大 . 而且 只 适合 好 梅子 点 法 构造 的 均匀 设 
计 ， 不 能 计算 正 交 设计 等 其 他 方法 所 产生 的 试验 点 的 偏差 。 最 近 ，Bundschuh and MRS 
辰 中 "给 出 了 计算 偏差 的 算法 ， 当 因素 不 太 多 时 ， 该 算法 可 精确 地 求 出 任何 点 集 的 偏差 。 

设 要 从 均匀 设计 表 Um") 中 移出 s 列 ,使 其 相应 的 均匀 设计 有 晤 小 偏差 。 当 wm 和 s 较 大 
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时 ,由 zm 列 中 取出 * 列 的 数目 有 Cs 之 多 , 要 比较 这 么 多 组 点 集 的 均匀 性 工作 量 很 大 , 需 用 简 
化 计算 和 近似 求解 的 方法 。 这 里 仅 介 绍 利用 整数 的 同 余生 来 产生 ho ho +, h RUTTER 
Фа ЗАР п WER, На, a (mod n), =. а (mod n) RHE, a7 21 (mod x), 
Шах л ККУ г, 例如 

21—2, 25-4, 2*=3. 2'=1(mod 5) 


则 2 对 5 的 次 数 为 3， 又 如 

3'=3, 38'—9, 3'—5, 3'—4, 3°=1 (mod 11) 

则 3 对 11 的 次 数 为 4。 一 般若 a 对 的 次 数 大 于 或 等 于 s 一 1， 且 a 与 互 质 ， 则 可 用 

(a°, се, a") (mod n) 

作为 生成 向 量 , 故 a 称 为 均 句 设计 的 生成 元 。 然 后 在 一 急 可 能 的 a (最 多 一 1 个) 中 去 比较 
相应 试验 点 的 均匀 性 ， 工 作 量 则 可 大 大 减少 。 理 论 和 实践 证 明 ， 这 种 方法 获得 的 均匀 设计 使 


用 表 仍 能 保证 设计 的 均匀 性 . 于 是 对 给 定 的 = Als, 只 要 求 得 最 优 的 ,使 可 获得 生成 向 量 , 从 
而 获得 相应 的 均匀 设计 表 。 
#419 UMU AE Re AA EUER НЕ 
п 2 4 6 7 
s. | 200.8100) 20.4900 
6 30. 1875) 3(0. 2656) 30. 2990) 
了 1 3(0.2398) 3(0. 3721) 3(0. 4760) 
8 4(0. 1445) 400. 2000) 2(0. 2709) 
9 | aco. 1944) 4(0. 3102) 2(0. 4066) 
10 | т00.1125) 7C0. 1881) 300. 2236) 5.2410) 700, 2994) 
11 740. 1632) TCO. 2649) 3€0. 3528) 7(0. 4286) 760. 4942) 
12 1 3(0. 1163) 60. 1838) 6(0. 2233) 100. 2272) 600. 2670) 600. 2768) 
13 | 360.1405) 6(0. 2308) 6(0. 3107) 4(0. 3814) 660. 4439) &(0. 4992) 
14 1160. 0957) 700. 1455) 7(0. 2091) 
15 11. 1233) 70. 2043) то. 2772) 
16 10(0. 0908) 5(0. 1262) 5(0.1705) 5(0.2070) 100. 2518) 20. 2769) 
17 1100-1099) 10(0. 1832) 19(0. 2501) 100-3111) 1060. 3667) 100. 4174) 
18 80.0779) 9(0. 1394) 9(0. 1784) 4(0. 2047) 300. 2245) 9(0. 2247) 
19 8(0. 0990) 8(0. 1660) 14(0. 2277) 14(0. 2845) 1460.3368) 14(0. 3850) 
20 1300. 0947) 5(0.1363) — 10(0.1915) — 10(0.2012) 1040. 2010) 
21 1300. 0947) 10(0.1581) 10(0. 2089) 1060. 2620) 1040. 3113) 
22 9(0. 0677) 1760. 1180) 17200. 1392) 1700. 1827) 170, 1930) 1160. 2195) 
23 17(0.0827) 15(0. 1397) 1700. 1930) 11(0.2428) 1760. 2893) 1100. 3328) 
24 1100. 0586) $0. 1031) $(0.144D — 120.1738) — 1200.2004) — 12(0.2198) 
25 1160. 0764) 11(0.1294) 1160. 1793) 1100. 2261) 460. 2701) 80.3115) 
26 | 160. 0588) 10(0. 1136) 500. 1311) 560. 1683) 1660. 1828) 500. 1967) 
27 2060. 0710) 20¢0.1205) — 20(0.1673)  20(0.2115) 1600.2538) — 16(0.2927) 
28 1800. 0545) 700. 0935) 70.1074) 1600.1381) 760. 1578) 700. 1550) 
28 2300. 0663) 90.1128) 7(0, 1596) 16(9, 1937) 1600, 2384) 1600, 2760) 
30 22(0. 0519) 22(0. 0888) 18(0. 1325) 1800. 1465) 1800. 1621) 1160. 1924) 
31 14(0.0622) — 12(0.1060) — 22(0.1477) — 12(0.1874) 1200.225) — 22(0.2611) 
37 17(0.0824) — 23(0.0930) 1700.1255) 70. 1989) 7€0. 1929) 70. 2245) 
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表 4-20 奇数 = 的 U; ЖЫЙ ЕЁ Ж SMART ARE 


B : [жй р n 
7 2 Gu ` 0. 1582 34.08 
3 (3.5.7) 0.2132 42.70 
9 z a) 751574 19.03 
3 (3,7,9) 0.1980 36.17 
n 2 158) 9.1136 30. 39 
3 ‹5,7,11) | 0. 2307 12.91 

13 2 0.9) 7 оор — As 
3 AD 0.1442 37.52 
4 0,5,9.10 0. 2076 Д 33.18 
15 2 GOD 9. 0833 32.44 
3 Q,5.12 0.1361 33.38 
4 (5,7,9,18) 0.1511 45.49 
_ 5 (57, 9911.15) , 0.1090 24.80 
17 2 D 0. 0856 22.11 
3 1.7.19) 9.1331 27.35 
4 (1.11,13,17) 9.1785 28.63 
19 2 aa) nox 23.7. 
3 (1.3,11) 0.1372 17.35 
4 (1.3.7.10 0. 1807 20. 64 
5 (7,9,11,13,18) 0.1897 33.32 
n i aan 0.0879 28.30 
3 Q9 0.1121 29.10 
4 (1.5.7.13) 0.1381 33.89 
E (1,9.13,17.19) 0.1759 32. 86 
23 2 aan 0. 0638 29.62 
3 (11,17,19) 0.1029 26.34 
4 ‹1,7,13,19) 0. 1310 32.12 
5 (11,.13,17,19,23) 0.1691 30. 35 
25 2 алр 0. 0588 23.04 
3 (3,5,25) 0, 0975 24.65 
4 ‹5,7,9,75) | 0.1210 32.52 
5 (11,15,17,19,21) 0.1532 32.24 
27 2 аир 0.0600 13.49 
3 (1.9.15) 0.1009 16.27 
4 (111415425) | 0.1189 28.93 
5 (3.13,17,19,27> 0.1378 34.85 
29 2 O49? 0.0520 16.27 
3 O,17,18) i 0. 0914 18.97 
4 ‹1,17,19,23) 0.1050 34.21 
5 (13,17,19,23,28) 0.1730 12.93 
31 2 a. 0.0554 10.93 
3 1,919) 0. 0908 14. 34 
4 (3.15,21,27) 9- 1100 25.52 
5 (5,9,11,17,19› 1 9.1431 23.64 


db 419 对 奇数 nC5 世 4 过 31.n 一 37) 给 出 了 U, 表 的 华威 元 及 其 均匀 设计 的 偏差 ,同时 对 
PRL (6<n 志 30) 给 出 了 U; 表 的 生成 元 及 相应 的 偏差 。 类似 地 ,对 奇数 4, 也 可 获得 U; 表 的 


100 


生成 向 量 及 相应 的 偏差 ( 表 4-20)。 此 两 表 由 方 开 泰 等 算出 0$。 综 合 两 个 表 的 结果 ,可 作 如 下 
LB 

(D HAR n U: RE U, 表 有 更 好 的 均匀 性。 Bl n= 155-4 M LU, CISO ARA D= 
9.2772, ПТ U; (159 A 3299 D=0.1511, SATA HET. 45.49%, 

@ 车 固定, 当 ; 增 大 时 , О, de GRUZIGRO 的 偏差 也 随 之 增 大 , Bs 固定 , U, ЗИН 
Ain 的 增 大 而 减少 , 而 U; 表 的 偏差 一 般 也 随 之 增 大 而 减少 , 但 有 少数 例外 、 其 原因 是 它们 
的 Ut: 表 的 可 能 列 数 Elx 十 1) 不 太 多 ， 但 其 中 选择 s 的 可 能 组 合 也 不 多 ， 从 而 最 小 偏差 相对 
RAK: 

@ 表 419 列举 的 U, dem U; 表 是 由 生成 元 方法 生成 的 ,而 表 4-20 BU; 表 是 考虑 从 
U RPEN s 列 的 一 切 可 能 的 组 人 台 ， 所 以 生成 向 量 中 不 一 定 包含 1 。 

均 名 度 度量 的 方法 很 多 ， 最初 王 元 、 方 开 泰 "提出 了 近似 偏差 的 均匀 性 准则 ， 利用 这 个 
ЖЕШ, ЖИТЕН Т азі 的 使 用 表 。 丁 元 5 利用 最 优 实验 设计 理论 中 的 4 RRA D 最 优 准 
则 ， 给 出 了 相应 的 使 用 表 ， 蒋 声 和 陈 瑞 下 0*' 从 几何 的 观点 提出 了 体积 距离 的 度量 。 方 开 泰 
ALAA AO 也 从 几何 的 角度 建议 用 最 大 对 称 差 的 条 件 来 度量 均匀 性 , 并 提出 了 均匀 性 度量 必 
RE EWR 


三 、 拟 水 平均 匀 设 计 


由 十 在 实际 的 化 学 实验 和 化 工 生 产 中 情况 变化 很 多 ， 有 时 各 个 因素 的 水 平 数 是 各 自 不 同 
的 ， 唯 如 此 方 可 与 实际 情况 相同 ， 所 以 ， 在 实验 设计 中 就 有 所 谓 的 拟 水 平方 法 ， 即 针对 实验 
设计 诸 因素 的 水 平 数 存在 不 相同 的 情况 下 的 一 种 设计 ， 有 时 也 称 为 混合 水 平 设计 。 先 看 一 个 
简单 的 例子 。 若 在 一 个 试验 中 ， 有 两 个 因素 4 和 B 为 三 水 平 , 一 个 因素 C 为 二 水 平 ， 这 个 试 
THERE LXI KEH, 这 等 价 于 全 而 试验 , 并 且 不 可 能 找到 比 Lis 更 小 的 正 交 表 来 
安排 这 个 试验 。 直 接 运用 均匀 设计 似 也 困难 ， 但 如 引 人 所 谓 拟 水 平 技 术 ， 就 可 用 均匀 设计 表 
来 安排 试验 了 。 对 此 例 , 可 用 Us (6) 表 中 ( 表 4-18) 的 前 三 列 来 进行 安排 , 将 因素 4 A В 
在 前 两 列 ， 将 C 放 在 第 三 列 ， 继 续 将 前 两 列 的 水 平 两 两 合并 ， 即 ，{1 ,2}) 一 1,13,4j 全 2,15， 
6)=>6; 第 三 列 则 合并 成 为 二 水 平 ; (1,2,3}=1,{4,5,6} 一 2， 这样， 可 得 如 表 4-21 所 示 的 拟 
水 平均 匀 设 计 表 U4(3X2)。 这 个 表 具 有 很 好 的 均衡 性 , 例如 , 4 ЖС BI, BAC AAR 
因素 设计 正好 组 成 它们 的 全 面试 验方 案 ，4 列 和 睛 列 的 两 因素 设计 中 也 没有 重复 试验 。 


ar 所 水 平 设计 如 ,C37X2) 


列 导 FS | 
A B C 试验 号 H A В с 


1 Gu Gu GM 4 ID an {5)2 
2 Gu (4)2 (6)2 5 (5)3 (322 02 
3 2 (6)3 《2)1 6 (623 (523 De 


但 并 不 是 每 一 次 作 拟 水 平 设计 都 能 这 么 好 。 如 要 安排 一 个 二 因素 《4，B) 五 水 平和 一 因 
RO) 二 水 平 的 试验 ， 若 用 正 交 设计 ， 可 选 Lw 表 ， 但 试验 次 数 太 多 ， 若 用 均匀 设计 ， 可 用 
dE 4-24(7)U; ПООЖ 1. 5. 6 列 来 进行 来 安排 。 将 1、5 列 的 每 两 水 平 进 行 合并 ， 即 ， 
O2) 1, (3,4792, (9,10) 25, 而 将 7 列 的 每 五 水 平 进行 合并 ， 即 ，{1,2,3,415} 地 1， 
(6,7,8,9,101=2, 于 是 可 得 到 如 表 4-22 所 示 的 拟 水 平均 匀 没 计 。 此 表 的 AAC A, 有 两 
个 (2,2), 但 没有 (2,1)， 有 两 个 (4,1)， 却 没有 (4,2)， 因 此 均衡 性 不 好 。 


试验 号 
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表 4-22 ЮЖ Шах) (一 ) 
T — 一 
щей С AG A B c au 7 A B c 
1 ЕП {5)3 Dz a ШЕП Gu m 
2 ол oaos (Q1 ; (A Qu (5)1 
3 (G2 (492 (1032 8 (4 UM аз 
4 (402 (325 (602 9 (955 a (8)2 
5 (53 C32 Qu 10 (1025 623 421 


A U%(10*) 的 均匀 设计 表 实 际 有 8 Я], 2 


22 示 出 的 要 好 。 


RAB 氢 水 平 设计 UGG X2) C 


其 实 , 在 这 8 列 任 取 3 列 的 一 个 组 合 都 可 以 用 来 设 
ib. йш. ШЖ ЫШ U%(105) 表 的 第 1、2、5 列 来 进行 上 述 氢 水 平安 排 ， 可 得 如 表 4-23 的 
ОХЬ, 注意 此 设计 既 具 有 均衡 性 , 而且 其 偏差 D=- 0.39 
计 表 所 有 仔 取 三 列 来 组 合 所 得 偏差 的 最 小 值 。 所 以 , 9 4-23 Н 


25, 达到 了 Uno yak 
上 的 拟 水 平 设 计 似 应 比 表 十 


~ A8 > 列 号 ' 

RES A B C 试验 号 —. A B [^ 
T [TII Gn бл 7 6 [E аз 2 
2 (21 (402 092 7 4 (202 (251 
3 Quo 0603 an 8 (4 юз me 
4 ар (84 0902 9 «995 Ms an 
E es aos (31 to ans (05 (6)2 


四 、 均 匀 设 计 表 


本 节 将 试验 次 数 从 5 到 26 均匀 设计 表 收 集 于 此 节 ( 表 4-24)， 以 供 读者 方便 选用 ， 注 意 
到 均匀 设计 的 试验 次 数 是 可 与 水 平 数 相对 应 的 , 也 就 是 说 , 可 以 据 此 来 安排 具有 26 水 平 的 斌 
ат. 因素 的 个 数 也 最 高 可 达 12 个 。 在 此 节 中 同时 提供 的 使 用 表 给 出 了 每 种 可 能 组 合 的 偏差 
值 , 读者 可 根据 具体 的 情况 , 即 试验 次 数 、 水 平 数 及 均衡 性 等 条 件 与 偏差 值 一 起 来 综合 考虑 ， 


灵活 选用 。 


а) Us 《53) 均 名 设计 表 


表 4-24 均匀 设计 表 汇 集 


试验 号 1 2 3 试验 号 1 2 3 
1 1 ? 4 4 4 3 1 
2 2 4 3 5 5 5 5 
3 3 1 2 
(la) L5(C5?? 使 用 表 
е ж я 号 а x 
2 1.2 0.3100 
3 1,2,8 0.4570 
(2) UN 69 均匀 设计 表 
试验 号 1 2 3 4 REY 1 2 3 4 
1 1 2 3 6 4 4 1 5 3 
z 2 4 6 5 Š 5 3 1 2 
3 š 6 2 4 6 6 5 4 1 
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(2a) Us (GG UB 


* № 列 号 LEE 
1,3 E 0.1875 
3 1,2,3 0. 2656 
4 1,2,3,4 0. 2900 
(3) U; (7 ) 均 匀 设 计 表 
p" 1 2 3 n ] 试验 号 1 2 3 4 
1 1 3 了 3 1 1 3 
2 2 в 8 H 2 6 2 
3 3 1 5 7 5 3 1 
4 4 4 4 
(3а) U CORBE 
Ж Ж m LEES a # 
2 1,3 0.1582 
3 2,3,4 0.2132 
(4) U; (085 均匀 设计 表 
试验 号 T 1 2 3 4 5 2 3 4 E 
17 1 2 4 1 8$ 1 2 8 1 
2 2 4 8 5 7 3 6 6 š 
3 3 6 3 3 6 5 1 4 2 
4 4 8 了 1 5 7 5 2 1 
(42) Us GONER 
E * ЕД 5 ж x 
2 L8 7" близ — TU 
E 1,3,4 0. 2000 
4 1,2,8.5 0,2109 
(5) U,QODISA REGERE 
试验 号 1 2 3 4 5 试验 号 1 2 3 4 i 
1 1 2 4 7 8 Се 3 8 6 3$ 
2 2 4 8 5 7 7 7 5 1 4 2 
3 3 6 3 3 6 8 8 7 5 2 1 
4 4 8 7 1 5 9 9 9 9 9 9 
5 5 1 2 8 4 
(5а) U,CO E FERE 
# Жж я 号 A Žž 
2 1,3 0.1944 
3 1,34 0. 3102 
4 1,2,3.5 0. 4066 
(6) Un DHIR 
试验 号 1 2 3 4 5 6 试验 导 1 2 3 4 5 6 
1 1 2 3 5 7 10 7 7 3 10 2 3 4 
2 2 4 6 10 8 9 8 8 5 2 7 1 8 
3 3 6 9 4 0 8 9 9 7 5 1 8 2 
4 4 8 1 9 6 7 ш 10 9 8 6 4 1 
5 5 10 4 3 2 6 H non NH H N MH 
6 6 1 7 8 9 5 
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(ба) Unt ORAR 


# * a 号 LN # ж | Ш À * 
2 1,5 | 0.1632 5 T resas 0. 4286 
3 1,4,5 0. 2649 6 ， 1,2,3,4,5,6 0. 4942 
4 1,3,4,5 0. 3528 | | 
т) Ui LOS STR e 
试验 号 1 2 3 4 5 8 了 8 
1 1 z 3 + EP T 9 то 
А 2 4 6 8 10 3 7 8 
š 3 6 9 1 4 1C 5 8 
4 4 8 1 5 9 є з т 
E 5 10 4 E] 3 2 1 в 
6 6 1 7 z R E 10 5 
i 7 3 10 5 2 £ 8 4 
8 8 5 2 10 7 1 5 3 
B 9 7 5 3 1 £ + 2 
10 10 9 8 7 6 4 2 1 
(7a) Ui C20 f FAR 
ГЕ я s a ox 2 ж т š ox 
2 1,6 0.1125 5 OPEN 0.2414 
3 1,8,6 0.1681 8 1,2,8,5,6.8 0. 2994 
134,5 0. 2236 
(8) US5025 8) BTE 
试验 号 1 2 3 4 š 6 7 8 9 10 
П 1 2 3 4 % ND 10 12 
2 2 4 6 8 30 12 5 7 u 
3 3 6 E] 12 2 E] u 1 4 10 
4 4 8 12 3 7 ц 6 10 1 9 
5 5 10 2 7 12 4 1 6 u 8 
6 & и 5 u 4 10 9 2 8 7 
7 7 1 8 2 9 3 4 п 5 6 
8 8 3 "n 6 1 9 12 T z 5 
9 9 s 1 10 6 2 7 3 12 4 
10 10 7 4 1 n 8 z 12 9 3 
n u 9 7 5 3 1 10 8 6 2 
12 12 1 16 9 8 7 5 4 3 1 
(Ba) Ui 12704 A 
е * A 号 я 2 维 ж » 号 а * 
2 | 15 0.1163 5 1,3,4,8,10 0. 2272 
3 16,9 0. 1838 6 1,2,6,7,8,9 0.2870 
4 1,6:7,9 0. 2233 7 | 1,2,6,7,8,9,10 0. 2768 
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(9) Ust1359) 均 匀 设 计 表 


试 © 1 2 3 4 5 6 7 8 
1 1 2 5 5 9 10 12 
2 2 4 10 2 a 5 7 m 
3 3 6 2 5 11 1 4 10 
4 4 8 т 11 6 10 1 9 
5 5 10 E 4 1 6 1 8 
5 6 12 1 10 А 2 8 т 
7 7 i Li 3 4 11 5 6 
8 8 3 1 9 12 7 2 E 
9 n 5 6 2 u 3 12 3 
10 10 7 1 8 2 12 9 3 
n u 9 3 1 1: 8 6 2 
12 12 u 8 т 4 3 1 
13 13 13 IE 13 m 13 13 13 
(942 Uif135 使 用 表 
# Ж ПЕЕ ГЕ # 数 | 列 оз & ж 
z 1,3 195 5 14567 7 0.3814 
3 1га 0. 2308 á 1.244,5,6,7 0.4439 
4 | pes 0.8107 f n [_1.2.4,5,6.7,8 0.1992 
(10) UnOA) Ap EHE 
试验 号 1 2 3 4 5 试验 号 | 1 2 3 4 5 
1 ñ 4 7 п 13 8 8B 2 m 13 m 
2 2 8 14 7 n 9 E] 6 3 9 12 
3 3 12 8 3 4 10 ла 10 10 5 10 
4 la 1 13 n 1 Hoo, N 14 2 1 8 
5 5 5 5 10 5 12 | 12 3 9 12 6 
6 6 9 12 6 3 13 5038 7 1 ë 4 
7 1 13 4 2 1 14 14 u 8 4 2 
(10а) Uy, CHA fF 
E к 列 9 W = Ej к 列 号 ж 2 
2 7 14 0. 0957 4 23.5 0. 2091 
3 1,2,3 0.1455 
aD Uis :157) 均 名 设计 表 
试验 号 1 2 3 4 5 в 7 | BO 1 2 3 4 5 6 7 
1 1 5 7 9 1 n 1 n 79 з 5 1 3 5 7; 
2 2 010 H 2 6 100 14 10 Ç Ó 2 6 1 H 2 6 
3 y 5 5 H 1 7 Bf N 1 7 8 3 9 B 5 
4 1 £ J 4 R 4 B 12 ош о ао 4 £ оу 
5 3 2 3 13 T 1 11 13 13 1 11 5 15 9 3 
6 3 14 10 6 2 14 10 14 14 6 2 14 10 8 2 
? 7 3 1 15 B H 9 15 ls ы 9 17 5 3 1 
8 ; 8 8 8 8 8 ë gj 


(Па) Un (15088 B K 


ж Ж » 85 ox Тя & | " 8$ ж а 
2 1.3 0. 0833 4 i 1.7241,8 0. 1551 
3 1,2,6 0.1361 5 2,3,.4,5.7 0. 2272 
(12) Une sae E 
试验 号 T 2 3 4 5 6 7 8 9 10 п 12 
1 1 z n 5 6 8 9 m 13 14 15 16 
2 2 4 8 10 12 16 1 3 9 11 13 18 
3 3 6 12 15 1 т 10 13 5 8 1) 14 
4 4 8 18 3 7 15 2 6 1 5 9 13 
5 5 10 3 8 13 5 11 16 14 z 了 12 
6 6 12 7 13 2 14 3 9 10 16 5 11 
7 7 14 li H 8 5 12 2 6 13 3 10 
8 8 16 15 6 14 33 4 12 a 10 1 9 
9 9 1 2 п 3 4 13 à 15 7 16 8 
10 10 3 6 16 9 12 5 15 Hi 4 14 7 
11 1 5 10 4 15 3 14 8 7 1 12 6 
12 12 7 14 9 4 11 6 1 3 15 10 E 
13 18 9 1 14 10 2 15 11 16 12 Li + 
14 14 11 5 ? 16 10 7 1 12 9 6 3 
15 18 13 9 T 5 1 16 14 8 в 4 2 
16 6 15 13 12 11 9 8 了 4 3 2 1 
(12a) Uis(16") 使 用 表 
# Ж 列 号 a 2 [а & ЛЕ A ox 
2 1,8 0. 0908 5 1.4.5.6.9 0. 2070 
3 1,4,6 0.1262 5 1,3,5,8,10.11 0.2518 
4 1455,6 0.1705 т | 1.2,3.6,9.1.12 0.2769 
аз уьавояч н 
RMF 1 2 3 4 5 ñ 7 8 9 10 il 
1 1 3 4 5 n 7 8 9 П 15 16 
2 2 6 š 10 12 14 16 18 3 11 13 
3 3 9 12 15 18 2 5 8 14 7 10 
4 4 12 16 1 5 9 13 17 6 3 7 
5 5 19 1 6 11 16 2 7 17 18 4 
6 6 18 5 li 17 4 10 16 9 14 1 
7 т 2 9 16 4 n 18 6 1 10 17 
8 8 5 13 2 10 18 z 15 12 6 14 
9 9 8 17 7 16 6 15 5 4 2 11 
10 10 п 2 12 3 13 4 14 15 17 8 
11 11 14 6 17 9 1 12 4 7 13 5 
12 12 17 10 3 15 8 1 13 18 9 2 
13 13 1 14 8 2 15 9 3 10 5 18 
м м 4 18 13 8 3 17 12 2 1 15 
15 15 u 3 18 14 10 6 2 13 16 12 
16 16 10 7 4 1 ? м 11 5 12 9 
17 17 13 11 E 7 5 3 1 16 8 6 
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аза) U G8 Df RR 


и om я s а 2 Га ж E" m ox 
2 |ui 0.0779 5 13,6811 OO D. 2047 
3 1,4,8 0.1394 6 1.2,4,7,8.10 0. 2248 
4 1.4.6.8 0. 1754. 7 1,4,5,6,8,9,.11 0.2247 
14) U5 (22015) Н 
试 验 号 1 2 3 4 5 6 8 8 10 п 
m 1 5 6 8 9 1 14 17 20 21 
2 z 19 12 16 18 22 5 11 17 19 
3 3 15 18 1 4 10 19 Б 14 17 
4 4 20 1 9 13 21 10 22 11 15 
5 5 2 7 17 22 9 1 16 8 13 
6 6 7 13 А 8 20 15 10 5 n 
7 7 12 19 10 17 8 5 4 2 9 
8 8 17 2 18 3 19 20 n 22 7 
° 9 22 8 3 12 7 11 15 19 5 
10 19 4 14 1i E 18 2 9 16 3 
11 11 9 20 19 7 6 5 16 3 13 1 
12 12 14 3 4 16 17 18 了 20 10 22 
13 13 18 9 12 2 5 š 21 14 了 20 
14 n 1 15 20 n 16 21 12 8 4 18 
15 15 6 21 3 20 4 11 3 2 1 16 
16 16 11 4 13 6 15 1 17 19 at 14 
17 17 16 10 21 15 3 14 8 13 18 12 
18 18 21 16 6 1 14 + 22 7 5 10 
19 19 3 22 14 10 2 17 13 1 12 8 
20 20 8 5 22 19 13 了 4 18 9 $ 
n д 13 n 7 5 1 20 18 12 5 4 
22 22 18 17 15 14 12 10 9 6 3 2 
(14a) U; (220 ME ШЖ 
= k al 号 W = = ж 列 m ж ж 
2 L5 0. 0677 5 | 1,4,7,8,9 0.1827 
3 1,7,9 0.1108 b 1.4,7,8,9,11 0.1930 
4 1,7,8,8 0.1382 了 1,2,3,5,6,7,10 0. 2195 
(15) Ол (249) HORE 
X 验 号 1 2 3 4 5 6 7 8 3 
1 1 3 6 7 n п 12 16 18 
2 2 6 12 14 18 22 24 7 13 
3 3 9 18 21 2 8 11 23 7 
4 4 12 24 3 п 19 23 14 1 
5 5 15 5 10 20 5 10 s 20 
6 6 18 m 17 4 16 22 21 mn 
7 7 21 1 24 13 2 9 i2 в 
8 8 ET 23 6 22 13 a 3 2 
9 9 2 4 13 6 24 8 19 21 
10 10 5 10 20 15 10 20 10 15 
11 11 8 16 z 24 21 7 1 9 


续 表 

wR © 1 2 3 4 5 6 了 8 9 
12 12 m 2 9 8 T 19 7 Я 
13 13 M 3 16 17 18 6 8 22 
14 14 17 9 23 1 4 18 4 16 
15 15 20 15 5 10 15 5 15 10 
16 16 23 21 12 19 1 0 6 4 
17 17 1 19 3 12 4 22 23 
18 18 4 8 1 12 23 16 13 17 
19 19 了 14 8 pi 9 3 4 п 
20 20 10 20 15 5 20 15 20 5 
21 т 13 1 2 14 6 2 и 24 
22 22 16 7 4 23 17 м 2 18 
23 23 19 13 n 7 3 1 18 12 
24 24 22 19 18 16 14 13 9 6 

(15а) U; QA ERE 

* » 号 а = = а 其 

2 1.6 0. 0586 5 ~ 0.1758 

1,3,6 0.1031 6 0. 2064 

4 1,5,6,8 9.1441 7 0. 2198 

Q6 Ux (26 SORT 

试 验 号 1 2 3 4 5 6 7 8 9 10 м 
1 1 4 5 7 10 13 16 17 19 20 25 
2 2 8 10 м 20 26 à 7 m 13 25 
3 3 12 15 21 3 12 n 24 3 6 n 
4 4 16 20 1 13 25 10 14 22 26 19 
5 5 20 25 8 23 п 26 4 м 19 17 
6 6 24 3 15 6 24 lā 21 6 12 15 
7 7 1 8 22 16 10 4 11 25 5 13 
8 8 5 13 2 26 23 20 1 17 25 n 
9 3 3 18 9 9 9 9 18 9 18 9 
10 10 13 23 16 19 22 25 8 1 и 7 
11 її 17 1 28 2 8 n 28 20 4 5 
12 12 2 6 3 12 n 3 15 12 M 3 
13 13 25 п 10 2 7 19 5 4 17 1 
u 14 2 16 17 5 20 8 22 23 10 26 
15 15 в 21 24 15 6 24 12 15 3 24 
16 16 10 26 4 25 18 13 2 了 23 22 
17 17 14 4 àl 8 5 2 19 26 16 20 
18 18 18 9 18 18 18 18 9 18 9 18 
19 19 22 м 25 i 4 7 26 10 2 16 
20 20 26 19 5 Hu 17 28 16 2 22 и 
21 21 3 24 12 21 3 12 6 21 15 12 
22 22 7 2 19 4 16 1 23 13 8 10 
23 23 п т 26 14 2 17 13 5 1 8 
24 24 15 i2 6 24 15 6 3 24 21 в 
25 25 19 17 13 7 1 22 20 16 м 4 
26 26 28 22 20 17 м 11 10 8 1 2 
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(62) Ug GG" 48 ЖЖ 


s ж 9] 号 LEE: в Ж i 列 5 ж x 
2 17 0. 0588 5 1.23:8,11 bae 
3 1,5,9 0.1128 6 1624465749 0. 1828 
4 1.3,8,1] 0.1311 7 1.2.3,8,9,10,11 0.1967 


ЖАЯ 最 优 试验 设计 


前 凡 节 所 有 讨论 的 试验 设计 方法 都 是 假定 模型 的 设计 矩阵 交 已 经 给 定 ， 实 际 上 ,所 有 试 
BLT HATERS X 的 值 有 着 密切 的 关系 。 因 此 ， 如 何在 试验 前 〈 若 能 做 到 的 话 )， 
适当 地 选择 因素 的 值 CA X ERE, 使 得 天 矩阵 在 统计 推断 中 能 具有 某 种 统计 优良 性 质 , 这 个 
问题 是 十 分 重要 的 , 也 是 近 20 多 年 来 试验 设计 中 一 个 活 牙 的 研究 课题 , 本 节 拟 讨论 的 最 优 设 
计 法 就 包括 这 方面 的 问题 ， 希 望 更 多 了 解 这 方面 情况 的 读者 可 参看 有 关 专著 9。 


一 、 最 优 设 计 的 各 种 准则 


为 讨论 问题 的 方便 ， 在 此 将 前 述 的 试验 设计 回归 模型 改写 为 以 下 更 为 一 般 的 回归 模型 
p=Bfi(x)+ Bole) + + B, D +e (4-19) 
其 中 x 为 试验 因素 空间 的 一 点 ， 如 试验 因素 空间 是 p 维 欧 氏 空 间 ， 那么 x 就 是 НЕ. 
(x) Gi 一 1,2，… ,mm) 都 是 该 试验 因素 空间 的 点 的 连续 函数 。 俩 如 ， 当 试验 因素 空间 为 2 维 时 ， 
Вр x= (ziyz:), 如 取 因 素 的 所 有 二 次 项 来 构成 试验 设计 的 回 妇 模型 的 话 ， 就 可 下 
fiG)=1 


f(x) = 


fi) =z, 
fi (x) = хул; 
f.G)= = 
fe Cx) =x? 
此 时 ,试验 设计 的 具体 回归 模型 就 可 写成 
у= Вох Воле + Byrne 81 Bore (4-20) 
当 试 验 计划 进行 n 次 ,由 式 (4-19) 表 出 的 回归 模型 可 得 
>= Bh Gs fef Gn) d + Bin te G=1,2, n) 
其 试验 设计 年 阵 X 为 


f G) feG c f 
_ Дым Fae) S Б (4-21) 
f(x.) foe) c Oe.) 


Ж, TBR TW i PT EO), 

这 样 ， 就 可 通过 选择 王 矩 阵 而 使 由 式 〈4-2) 表 出 的 回归 模型 可 知 , 使 由 式 (4-20 ADE 
设计 称 为 可 行 设 计 . 记 所 有 可 行 设计 的 全 体 组 成 集合 为 嗲 .. 所 谓 最 优 坛 验 设计 就 是 指 从 只 ,中 
找 出 一 个 ¥ER。， 使 式 (4-2) 的 最 小 二 乘 估计 具有 某 种 “优良 性 ”。 

“优良 性 ” 指 什么 ?这 涉及 到 不 同 的 准则 ,下面 从 不 间 的 角度 介绍 风 种 常用 的 优良 性 准则 。 

D 4- 最 优 准则 ”对 任 取 xe %, 有 
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B= OK) Xy (4-22) 
而 
cov(P)=cov[(X'X) 7 X' y]=o'(X'X) 1 (4-23) 
在 此 ， 为 回归 模型 的 估计 误差 的 方差 。 若 存在 X C, E 
ucov(B] = tro (XE) J = min ЎА (4-24) 


4- 最 优 是 协 方差 矩阵 的 特征 值 之 和 最 小 准则 ， 或 称 平均 方差 最 小 准则 。 
(2) E- 最 优 准 则 ” 若 存 在 Xe ER, du 
Ass (X EXE) = тахА OO (4-25) 
成 立 ， 则 称 X: 为 E- 最 优 的 设计 和 矩阵。 其 中 ju 为 信息 矩阵 〈 难 Xe) 的 最 小 特征 值 。 故 E- 最 


优 是 信息 年 阵 的 最 小 特征 值 最 大 准则 。 
(3) 也 -最 优 准 则 BARE XDER,, wE 


|ХьХь| = тах |XX | (4-26) 
成 立 ， 则 称 X, 为 НОНЕ РЕ. 其 中 |. ЖЕДЕ (XX) 的 行列 式 值 。 Be D- 最 优 是 
信息 矩阵 的 行列 式 值 最 大 准则 。 
COD б-а ЖЕЖХЄЎ, 有 
y-XB B y»—xB—xQOU07 Xy (4-27) 
所 以 有 


var (yi) =var (xi (X'X) Ky) = xi (XX) C 1X'var(y)X КХХ) lx; СКХ) 1,07 
则 
var(y)=x(X'X) 7 xo? 
若 存在 Xx, CR, 818 
dX) = min max x OX x 
成 立 , 则 称 XC, 为 C- 最 优 的 设计 和 矩阵.C- 最 优 准则 是 使 预报 值 在 整个 区 域 中 的 最 大 方差 达到 最 
小 的 设计 ， 故 也 称 min max 设计 。 
上 面 都 是 假设 试验 次 数 是 固定 的 ， 通 常 称 为 离散 型 设计 ， 记 竹 阵 
M=1/n(X'X)== Gu) 
为 信息 阵 。 以 上 介绍 的 各 种 最 优 准 则 实质 上 是 讨论 信息 阵 的 某 一 函数 {CaM) 的 最 小 值 问题 。 设 
9 Br MHI (试验 区 域 )，Kiefer 在 R 引进 一 个 测度 x(x)。 定 义 信息 阵 M mon P 
mA 


my = [асо (4-28) 
给 出 了 一 个 测度 p(x) 就 相当 于 给 出 一 个 设计 , 这 样 的 设计 称 为 连续 型 设计 。 Kiefer 证 明了 在 
连续 型 设计 中 DART G- 最 优 的 等 价 性 的 著名 定理 。 但 在 离散 型 设计 中 ， 有 例子 说 明 D-E 
优 可 以 不 是 G- 最 优 。 在 最 优 试验 设计 中 ， 有 实际 应 用 意义 的 是 离散 型 设计 。 
二 、D- 最 优 设 计 
Р (4-2) 表示 的 回归 模型 可 以 编制 出 各 种 试验 设计 ,评价 这 些 设计 的 好 坏 ,可 以 从 
试验 点 的 多 少 (如 部 分 因子 设计 、 均 匀 设 计 )， 也 可 以 从 计算 简 繁 “ 如 因子 设计 、 正 交 设 计 
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等 ) 来 评价 。 从 上 节 的 讨论 可 知 ，DD- 最 优 设计 是 从 对 模型 的 参数 8 的 估计 好 坏 来 评价 的 。 
对 给 定 的 模型 , 可 以 寻找 一 个 试验 设计 О, 通过 试验 得 到 一 组 数据 , 然后 根据 最 小 二 乘法 

来 获得 的 估计 。 对 于 不 同 的 试验 设计 ， 可 得 到 不 赔 的 最 小 二 乘 估 计 。 为 了 评价 这 些 参 数 佑 

计 的 好 坏 ， 需要 对 这 些 参 数 的 估计 秆 进行 综合 考察 ,DPD- 最 优 就 是 用 它们 的 密集 椭 球 体 的 体积 


的 大 小 来 评价 的 。 
设 所 研究 问题 的 回归 模型 为 
у= В. +8? te 
ЖАҒ --1<:<1 上 比较 下 述 两 个 试验 设计 
s Ts=0 zs 一 1 
M: 
m=5 m=5 m=5 
тү=—1 xw,=0 x,=1 
а. | 
n=4 m=] n4 


由 此 可 得 它们 的 试验 设计 矩阵 X 分 别 为 


X, 


X, 


ї 


Le УУ лл л шшш l L ыш ш шы ы шл ы шы ш юы ш кҥн к кю кю ы ы 


к< юк юз кэз  @ ф оф о e о к юк ыы м юы юы кю суф ос с о кю кою ы ёш 


(4-29) 


则 它们 的 信息 矩阵 XX). (ХХ) 分 别 为 


15 
(ХХ) = | 0 
10 
15 
(X,X.)= | 0 
8 
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0 10 
10 o| 
0 1] 
0 8) 
8 0| 
° al 


1OCX)|215X10X10—10X 10 10— 5x 10x 10—500 


ОХ.) | -15X8X8—8X8X8— 


7TX8X8—448 


SAU ОХХ) IRI (ХХ | ,所 以 ， 在 D- 优 良性 的 意义 下 ,设计 如 + Q, RE. 
三 、 等 价 定理 及 五- 最 优 设计 的 构造 


在 给 定 的 因子 区 域 上 ， 直 接 用 前 述 方法 来 研究 和 构造 D- 最 优 设计 ， 一 般 还 是 很 困难 
的 ， 因为 在 此 因子 区 域 吕 上 , 可 构造 无 数 个 设计 要 用 上 述 方法 对 它们 进行 一 一 比较 ,才能 
找到 真正 的 D- 最 优 设计 。 为 克服 这 一 困难 ， 人 们 又 研究 了 与 DD- 最 优 设计 有 关 的 G6- 最 优 设计 
的 等 价 问题 ,在 第 二 节 中 ， 曾 给 出 了 CG- 最 优 准则 ,该 准则 的 目标 是 使 预报 信 在 整个 区 域 中 的 
最 大 方差 达到 最 小 ， 即 对 于 因 于 区 域 旬 上 的 任意 两 个 设计 ONO, FA 

max dX, Q0 = тах f’ G)OGX0 fe) Стах (Xz) —maxf GO OG X2 РС) 


则 在 G- 最 优 意义 下 , GEO ШОО, 好 。 在 此 


f(x) = 


(foo) 
fio) 


Uo] 


下 面 来 看 看 由 前 节 讨论 的 两 个 设计 0, Я 0, 的 例子 ,对 于 由 式 (4-29) 表 出 的 回归 模型 ， 


设计 Q, 的 估计 方差 
A(X, Qf (x ОХ) ' f (x) 
15 0 
0 10 
10 0 
0.20 
sa| 0 
—0.20 


=(1,х,х) 


0. 20 一 0. 202° 


—( za Ë lox 


—0. 20-+0. 30z* 


0 —0.201 [1 
ао o B 
0 0.302 La? 


= (0. 20— 0. 204°) --0. 1027+ (— 0. 20 十 0. 302") 2” 
一 0. 31*— 0. 32°+0. 250. 1X (32* — 32 F2) 


BUR Gate 3:482) ТЕН ET 1x01 上 的 最 大 值 为 2， 所 以 
max d(X,, f) = max f GO OC X0 1 f(x)=1/10 max (31*—34?4-2)= (1/10) х2=0. 2 
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而 设计 (2, 的 估计 方差 
ЧС р) = р IKK) fC) 


15 0 871) 
= (1,0,1) 0 8 M B 
8 0 8 1 
0.1428 0 —0.1429][1 
=a- 0 0. 1250 0 |} 
一 0.1429 0 0. 2679) Lr] 


0. 1429—0. 1429x? 
=(1,252") Ë 125r | 
7-0. 14294-0. 26792. 
= (0. 1429— 0. 1429.55) +0, 1252?+ C70. 1429+0. 26792") x 


= (0. 2679x*— 0. 1608x*--0. 1429) 
MR (0. 26792'— 0. 1608z? 十 0. 1429) AF OBL 11 上 的 最 大 值 为 0. 1429、 所 以 
тах 0,22) —maxf GJ (ХХ) 'fG) = max (0. 26792'— 0. 18082*-F0. 1429) —0. 1429 
因此 ， 在 G- 最 优 意义 下 ， BHO, Еа. 
下 面 的 等 价 定理 告诉 我 们 ， DD- 最 优 设计 与 G- 最 优 设计 是 等 价 的 ， 其 证 明 可 参见 文 
献 [20], 
等 价 定理 ”下面 三 个 结论 是 相互 等 价 的 : 


Qul Oo 是 Dd. B 
ОУК) = max XOT YXGvr oj (4-30) 
@ 试验 设计 2 2 C- 最 优 的 ， 即 
max f'(x) (XXD О) еіп тах f'a XDS (4-31) 
@ 试验 设计 or i8 
тах (х) АХО FQ) =m RA BT BO (4-32) 


GJ&d ORB, РИА Р-НЕ, FRAN ЧИЗЕ, BUS eT 
定理 来 构造 出 一 个 设计 (此 例 引 自 文献 [20]》)， 然 后 应 用 等 价 定理 去 验证 其 中 -最 优 性 。 
在 4 维 立 方 体 一 1 所 zy 入 1，j 二 1]，2，"…，d Ee FdE KAIRA 
yf GO Bf God er Bafa x) te (4-33) 


RF 

m= (d+1)(d+2)/2 

fix)=1 

fuas 14 

faz; 16а 

f,G)= <=,z; 2d-- 2x, bm l&i«j«d 
设想 构造 这 样 的 DARL I , 它 的 试验 点 选 自 p 维 立 方 体 的 2* 个 顶点 ,每 个 点 赋予 测 
E x( 参 见 前 节 的 试验 设计 定义 。 实 际 上 ,试验 点 的 测度 一 定 , 则 其 试验 重复 次 数 也 就 唯一 确定 
了 ,试验 设计 也 就 唯一 确定 了 ) ;ZX2“ 个 楼 的 中 点 ,每 个 点 赋予 测度 CI X 277 — HT 
中 点 ,每 个 点 赋予 测度 *。 这 样 的 设计 Q 是 由 


N=2! *[8+4d-+d(d—1)] 
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个 试验 点 构成 。 例 如 2=3 时 ， 这 样 的 设计 О 是 由 8 个 顶点 、12 RRO PAR 6 个 二 维 面 的 


中 心 , 共 26 个 试验 点 构成 ( 见 图 4-10). AE 4-10 可 以 看 出 , 假 
如 d 维 立方 体 中 心 就 是 因子 空间 的 坐标 原点 ,那么 这 个 设计 了 
的 试验 点 的 坐标 就 只 能 取 0, 一 1, 1 三 种 情况 。 Hop LB SE 
标 都 不 为 0， 楼 的 中 点 的 坐标 中 只 有 一 个 为 0， 二 维 面 的 中 心 
的 坐标 有 两 个 为 0。 
显然 ， 要 寻找 这 类 DD- 最 优 设计 ， 就 是 要 找 出 满足 D. 最 优 
性 的 测度 x、v、r。 可 以 分 两 步 进 行 : 第 一 步 是 在 条 件 
Pete Dr=1 
Ж, RHEA СОКОВА К к. os т; 进一步 验证 
所 求 出 的 设计 是 否 满足 
max f GOUGX07 fd =m 
第 一 步 : 首先 写 出 上 述 设计 O A(X (2^ X (0 ]. 
上 述 模 型 的 信息 矩阵 可 一 般 地 表示 为 
Ux cayxan]2 Xp f Gf G* 
Eso Xf oo 
Se AO Tesi) 


Ур Ofna)? EPA of. 
fio 

式 中 гоо |^? 

| 


pO 


图 4-10 三 因子 设计 
的 试验 点 分 布 


Ve f.) fna) | 
ДЕЕ) 


XAfu 


ща=з it, 上 述 设计 中 的 三 类 点 及 其 二 项 式 的 取 值 列 于 表 4-25。 从 表 4-25 可 见 ， 对 


任意 i,j, &=0，1，2，3 都 有 


" 
Spa, = 0 (= 1,2,3) 

2 

D petat = 0 (i = 1,2,3) 
£1 


M 
D priy = 0 Gz0 


z 
ty = 
Pez zo = 
= 
26 
Qm =0 
тї 
26 
> Priza ra = 0 
= 


p= Уры = Урау 52 0 
= = 
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v= Y pala #0 
= 


表 4-25 设计 中 三 类 点 的 坐标 及 其 二 次 项 的 取信 


实验 点 测度 p, zo EI ES хз mix; халә лалә at 4 = 

1 1 1 1 1 1 1 1 1 1 

1 1 1 — 1 —4 -1 1 1 I 

# 1 1 -1 1 -1 1 -1 1 1 1 
rare А 1 1 -1 -1 -1 ч 1 1 1 1 
1 -1 1 1 1 1 1 1 1 1 

点 1 E 1 0l 1 1 -1 1 1 1 
1 -1 -1 1 1 —1 一 1 1 1 1 

1 —1 —1 一 1 1 1 1 1 1 1 

1 0 1 1 ° 0 1 0 1 1 

1 0 1 -1 ° n 1 O 1 1 

1 o =l 1 0 0 —4 0 1 1 

1 0 -1 -1 o D 1 0 1 1 
CABE 
点 ;12 条 楼 M 1 =l 0 1 n -1 0 1 o l 
的 中 点 1 —1 ° 1 o 1 0 1 0 1 
1 1 1 9 1 D 0 1 1 o 

1 1 c 0 — D ° 1 1 9 

1 E 1 0 — D 0 1 1 0 

1 -1 -l 0 1 0 o 1 1 0 

1 ° 0 1 0 D 0 0 o 1 

第 三 类 1 ° ° -1 ° 0 о 0 0 1 
EN l ° 1 0 о 0 0 0 1 ° 
ж. i 1 ° — o o 0 о о 1 ° 
维 面 的 中 心 1 1 0 9 ° 0 0 1 0 0 
1 -1 0 0 o D o 1 D 0 


如 果 在 上 述 设计 矩阵 〈 表 4-24) P, Ær j=l, 2, З r Aan SH, HZ ES B E 
阵 为 〈 空 白 处 为 等 ) 


l # # # 
Hw ve 
но ро 
Mov ov д 
cx OD EO " А (4-34) 
РА 
v 
о 
v 


信息 和 矩阵 [XC0)'XCQ)] 具 有 如 此 简单 的 形式 ,是 因为 在 每 一 类 点 中 , 除了 x 与 zi, z; 与 
= 闻 外 ,其 他 各 列 之 间 都 存在 着 正 交 性 。 只 要 设 人 8 中 的 试验 点 及 其 测度 满足 上 述 规定 ,这 一 
性 质 对 任意 正 整数 a 都 是 成 立 的 。 因 此 ， 在 一 般 情 况 下 的 信息 矩阵 有 如 下 形式 〈 空 白 处 为 


ж): 
1 w 
| u G 
ADX] | а, (4-35) 
| eave) 
suh, LO d 阶 单位 矩阵 ; и = Coe OHI 维 行 向 量 ; G 3 d 阶 方 阵 ， 其 对 角 线 元 素 为 
p, RETRA v. 
根据 试验 点 坐标 的 性 质 ， 可 以 算得 


p= Уры, = ut tod — D27 + ri C- (а – 101 
=2#°Ч8д-„(4—1)-+Ет[(4—1)(4—2)]} 


v= J prir #0 


= 
= prt -v(d — 2)2* 4+ c2 [Ch (4-1) — (4-2)] 
= (8u--Av(d — 2) +e (4 2) (4 —32]) 
3B SEHE GAERA СОХ (0) HAA 
LEX 2X (0) ] | 1447 (po) Let (47 1000—47] (4-36) 
XE URL о Ж CX OX) ААН ШӘЛЕ A (p 600.00 下 解 方程 组 
E Dx ca»x аре Qd-- De — [Gi -2)o-2 le —2(p — 2) Co 1)? =0 
BX XO /w= (a+ Iv? — L(d — 2) Gio 2) Jet (ри Dw —0 


解 得 
p (Cd 3) [BHAA 1 [G2 + 344-7) + (4 — 10 (4d? + 12d +17)" ] 
v= ((d--3)/[8044-1) (4-2)  [ (Ad! + 8d? + 114 5) + (2d? +d +3) CAd* 124-17] 
另 一 方面 .在 式 (4-37) 条 件 下 


Dat Det Xi 277 [Bet 4doj-d(d—1)r]=1 (4-37) 
解 上 & 和 "的 方程 组 得 
p= (d—1)(d—2) 24 (d — 22 ecc dd 100] (4-38) 
»—2-*[((4—3g—(G—2v— (d—2)] (4-39) 
та 2027146024] (4-40) 
THE 上 和 "的 值 代 人 可 得 
um [29164 4-2) GL 4-1) ad +1 2d — 25d" — 107d? + 85d? +4790 + 128) — 
(Gd'—4d—19)d(d 1) (d--3) (4d? - 12d 4-17)? (4-41a) 
v=[2 t (42-2) (d 0]? (C7 Gad? 164* — 11d*— 143d? —1494+139)4- 
(заа —18) (d—1» (d-- 39 (4d 124 Y) (4-41b) 
r=[2 (d +2) +1) J {d+24d 432 24d —119) — 
(d*--34 — 11) (da +3) UP HAHN) (4-410 
第 二 步 ; HR ELDA COD TR SER B 
a Б 
b Е 
xix a» = a (4-42) 
us 


-1 
v La-on 


# 
h—[uG-—De-dg]" 
s [а (d—2)0— (4—1) pg Vv) 
Jul 
а= pt (d—1)]h 
b —(— uh, — ph, nh) 
E аха 阶 方 阵 
sh [Go pO ++ [G6—9)/ (iv) 
E= гое DGIO K on Го? 0/0 4-43) 
tor Lf m" 42 —0)/ (0—0) JA sh H 


HE URL o BIA dO 00 — P GO OCGXO Oo) PE XIX.) 1!, 得 到 
A(X) = F'G)UGXD 7 foo = (d + D + 2)/2 — 53 (a? — 25) 
RE cH- ERY НЕЯ УК 162,1, jm12.,d E 
maxd (X, 0.) — f GO OGX 07 fG0 = (+ d +2)/2=m 

根据 等 价 定理 知道 ， 上 面 求 得 的 z. o. cS TERR DD- 最 优 设计 条 件 的 , URS 2. o. = 
是 最 优 测度 ， 它 们 构成 的 设计 是 DBR. 

在 4&5 的 情况 下 ,根据 式 (4-41) 算出 的 e. o, c 的 值 列 于 宸 4-26 中 。 

在 4 之 6 时， 上 面 这 种 DPD- 最 优 设 计 的 构造 方法 是 不 适合 的 ， 因 为 此 时 v0. 而 在 实际 上 
是 不 可 能 的 。 

= v. TRE 


4 p" v т p" | v | т 

1 0. 333 0. 333 0. 000 0. 03705. 0. 50384 0. 01185. 
2 0. 1458 0. 68015 0. 0982 0. 01926 | 0. 003125. 0. 004475. 
3 0.071975 0. 01895 0. 03280. 


四 、 构 造 DP- 最 优 设计 的 数 全 方法 


从 前 述 立方 体 设计 的 例子 可 以 看 出 ，D- 最 优 设计 是 先 通过 直觉 的 方法 给 出 试验 点 , 继 求 
出 在 这 些 试验 点 上 满足 D- 最 优 性 的 测度 ( 即 出 现 的 概率 ), 最 后 用 等 价 定理 进行 验证 , 这 些 构 
造 刀 最 优 设 计 的 方法 , 关键 在 给 定 的 因子 区 域 喉 中 合理 地 选择 试验 点 和 规定 测度 , 使 设计 的 
信息 矩阵 达到 最 优 。 然 面 ， 这 样 的 方法 只 是 在 一 些 最 简单 情况 下 才 是 可 行 的 ， 一 般 情 况 下 用 
这 种 方法 直接 构造 D- 最 优 设计 是 很 困难 的 。 所 以 人 们 又 转向 用 数值 方法 来 构造 D- 最 优 设计 。 
所 谓 数 值 方法 ， 就 是 在 给 定 区 域名 和 已 知 函 数列 O 的 情况 下 , 用 最 优化 方法 寻找 使 信息 
和 矩阵 行列 式 

ACD = СОКСО) =] ЈАС) Са) | = LG east ke Pipes b) 


(4-44) 


在 条 件 ABO Da- 


下 达到 最 大 的 to р G=1, 2, +, n) 的 值 。 
在 此 ， 所 谓 函数 列 f(x) 有 如 下 定义 ， 如 有 下 述 的 回归 模型 : 
Y= Bid Boat Bott Вл бл} t+ Baie (4-48) 
WIO 具有 如 于 形式 


СЕ (4-46) 


下 面 简单 介绍 一 种 寻找 D-RE ORANE. 为 了 方便 ， 仍 用 模型 (4-2) 式 来 进行 讨 
论 ， 在 介绍 -最 优 设 计 的 数值 方法 之 前 ， 先 介绍 丙 个 基本 概念 。 

с) 线性 组 合 设计 

设 


Pu Por spn G1 da sm 
是 两 个 规范 设计 , 则 按 试验 设计 的 定义 ,有 
£m Me=1; 9g, 20 Ma = 
Жа 是 [0,1] 区 间 上 的 数 , 则 
Sa — ap, + Stay, = а 95) +5) = 0—4) +е= 1 
因此 ,由 设计 O, ЖО, 得 到 的 设计 
na Xaa з Lom 
of aon “q | Gq; у 30, 
仍 是 一 规范 设计 ,并 称 0 2 0,0, 的 线性 组 合 设计 , 记 之 为 
Q— (0-720, raf (4-47) 


值得 指出 的 是 ,线性 组 合 设计 N WARE ACID 0,0, 48 BOR AW ACO. A9 Ж 
RS 


My Mize Xia ЕРТЕ И 
{ " 


АСО) = (0 DAM HA) (4-48) 
(2 一 点 设计 
只 含 一 个 试验 点 x 的 设计 成 为 一 点 设计 , 记 之 为 Q(xo) ,显然 ,试验 点 x 的 测度 为 p。 一 1。 
BOAO AER RIT 
ай sXe Xn 
Pishat opa 
并 设 名 (x) 是 09,(x) 与 Q(xo) 的 线性 组 合 设计 , 即 0.0) 5 
XX, X, Xo 
И а 
则 由 (4-48) 式 ,可 知 
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ACD = (1DAN) +aA(((x.))=(1—a)A(0.)+-a f(x.) f G7 (4-49) 
根据 行列 式 的 性 质 (参见 第 十 一 章 ) ,可 得 
АСО) |= 9) АСО) а/а) ЈР) | 
=(1— а)" (1+[а/01—а) ]dG (22). AGP) | 
BP don) BG Охо) HE BBE A8 хо 的 值 。 
(E) 一 个 构造 D- 最 优 设计 的 数值 方法 
从 前 面 的 讨论 可 知 ， 在 同一 回归 模型 下 ， 如 果 对 于 两 个 不 同 的 设计 Q, Ж 0,. 
AG) SAND WE DRE FP BRIO, ЕП, 好。 那么 ,对 于 任 一 设计 Q, 与 一 点 设 
HOG HALA BLT 2, 怎样 才能 使 O, HG O, 好 呢 ? 事实 上 .只 要 点 x, 是 设计 OC A E PR 
数 的 最 大 值 点 , 即 x 满足 


90.00) =maxd (x Dy) 
并 取 组 合 系数 «为 
a—[dGx 9) m ]/ {mLd (x 22 —11) (4-50) 
则 必 有 
А020 | AGR): 

即 设计 只 E О, 好 ,并 且 在 所 有 的 线性 组 合 设计 (1 一 2)0. 十 aQ(xo) 中 ,14(82,) | TT 
列 式 值 最 大 的 。 

按 上 述 方 法 ,由 初始 设计 0, 可 得 到 一 新 设计 人 2 ,如果 设 计 Q, 还 不 是 D-RI A, E 
02, 的 基础 上 ,再 找到 一 点 xz, 使 得 


dG 41) =maxd(x,Q) (4-51) 
并 取 组 合 系数 а 为 
a —[dG h) —m]/ n[ 2 G0 —1]1 (4-52) 
再 构造 一 个 设计 0, 与 一 点 设计 2, 的 线性 组 合 
A= Ca), + af (4-53) 
则 有 LA) > AA | 


Шо ШО, 好 ,如 果 设计 Q. 还 不 是 六 -最 优 的 ,又 可 按 上 述 方法 找到 一 个 RRE ERE 
程 ,结果 有 两 种 可 能 ,一 是 在 第 上 步 得 到 的 设计 0, WIE maxd Gr Q0 — m. BO, È р- ж. 
另 一 种 可 能 是 这 一 过 程 无 限 重复 进行 ,得 到 一 系列 设计 

Ж ЖЫШ ЫЫ 


HHA 
|A(Q.)|<|A(0,)|< |A(0,) |<: < AC) | n (4-54) 
VERA EXER PUE UC RR , Вр 
lim |АС0,) |= | AG") | (4-55) 
式 中 ,0 H D- 最 优 设计 。 
综 上 所 述 ,用 数值 方法 构造 DD- 最 优 设计 的 步骤 如 下 : 
Ф 给 出 一 个 初始 设计 Qs 
XX. se 
T 
БЫША 


其 中 
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p20, DP, = 1. R 1А00)1 20 


置 有 一 0 
© HAH БЕРЕ AQ) RIA) | 
O 在 因子 区 域 办 上 , 求 出 方差 是 数 d(x,02,) 的 最 大 值 
d=d(xoD,)=maxd(x,0) (4-56) 
式 中 
аб.) = P GOUX LX (Q0 FO 
@ ПЁ d —m«ACA 为 一 预 置 精度 ,一 般 取 A 王 0, 08) MELER D 就 是 要 寻找 的 近似 
万 -最 优 设计 ,否则 计算 
a=(d—m)/Lm(d—1)] 
O 作 设 计 a 与 一 点 设计 QCx) 的 线性 组 合 
Ол Aa) A+ e GO 
得 新 设计 De 并 计算 出 
AQ. D= 01 а)А(00) HAN] 
JACQ) EA HE d A | 


Bk=k+1 
© 重复 进行 人 @ 至 回 步 ， 直 至 d—m<s, 
用 上 述 算法 ， 可 算得 六 维 因子 空间 的 二 次 五 -最 优 设计 。 


五 、 饱 和 DD- 最 忧 设计 


一 般 说 来 ， 比 较 理 想 的 试验 设计 除 满足 某 种 优良 性 外 ， 还 要 求 它 所 包含 的 实验 点 数 越 少 
越 好 。 在 试验 设计 中 ,如 实验 点 数 等 于 所 要 确定 的 未 知 参数 的 个 数 ， 则 称 该 设计 为 饱和 设计 。 
值得 提出 的 是 ， 由 于 试验 点 数 与 未 知 参数 的 个 数 相等 ， 故 不 存在 剩余 自 由 度 ， 除 非 进行 重复 
试验 ， 否 则 无 法 对 回归 方程 进行 显著 性 检验 。 

(一 ) 一 次 饱和 D- 最 优 设计 

对 于 ; 维 立 方 林 一 1 入 xz 入 1，Cj=1， 2, =, s) 上 的 一 次 回归 模型 

y Bo Bint Bret Barst Bax 
存在 这 样 一 个 定理 ， 

在 s 维 立方 体 上 选取 《s 十 1) 个 点 以 组 成 一 次 饱和 -最 优 设计 时 ， 只 要 考虑 选取 各 个 坐 
标 都 为 一 1 或 1 的 那些 点 。 

在 这 个 定理 的 基础 上 ， 用 计算 机 可 很 容易 找到 * 维 立方 体 的 一 次 饱和 DD- 最 优 设计 : 

当 s=2 时 ， 正 方形 区 域 的 任何 3 个 不 同 顶点 都 可 组 成 D- 最 优 设计 

当 s 二 3 时 ,立方 体 区 域 上 由 25-: 个 部 分 顶点 所 构成 的 试验 设计 ， 是 DD- 最 优 设计 

当 s=4 时 ， 号- 最 优 设计 是 
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55 0, D-RERHE 


当 s=5 时 ,DD- 最 优 设 计 是 


—1 -1 =l —1 1 1 
1 1-1-1 -1 —1 
1-1 1 1 1 1 
5—7 01, XJPHEDUR E. 277 PRATT RAH, E DD- 最 优 设计 。 
FEMI, SAR 忒 是 一 个 方 阵 ， 所 以 信息 矩阵 
A(Q)= |X'X| = |р (4-57) 
ADRA, MRE IX A. — ВЕ, эщ (1) 是 2 的 整数 次 赛 时 ，* 个 因子 的 一 次 饱和 
了 DD- 最 优 设 计 ， 就 可 根据 本 章 第 一 节 所 讨论 的 部 分 因 于 设计 方案 来 进行 ， 
(=) 二 次 饱和 D- 最 优 设计 
对 于 二 次 回归 模型 


x= ñ + 282, + Msz, (4-58) 
J=} ©) 


f$ HB RAT BH +s ts +O) = (1-28 Hsls 10/2] 024-3858) = (а-Е1)(з3-++2)/2 个 ， 
那么 存在 不 存在 含 试验 点 个 数 就 为 т — (s+1)(s + 2)/2 的 饱和 D- RR? 有 人 已 经 证 
明 , 对 5s 之 7 不 存在 饱和 D-EU RI. 

34 s=2,3 时 ,饱和 也 -最 优 设计 列子 表 4-27, 表 4-27 中 还 列 出 了 s 一 2 时 的 7 点 和 8 点 的 
非 饱和 DD- 最 优 设计 。 

RF зга MUR DD- 最 优 设计 ,至 今 尚 未 解决 。 对 于 ;二 4, 有 人 找到 了 一 个 较 好 的 15 点 设 
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计 , 示 于 表 4-28, ER 4-28 中 
5 一 一 1 а=8= —0.25 
у= 0.60 | 8——h-0.05 


这 时 АС) = 1X (2) X (1 | —0. 344547 X 107* 
表 4-27 sil MAA Р-У 
= s=3 
试验 号 6 点 计划 7 点 计划 8 点 计划 10 点 计划 
= та ES Te т. + zr 21 r; 
1 一 1 =l 一 1 -1 -1 -1 一 1 一 1 一 上 
2 1 —1 1 -1 1 —1 | 1 -1 =l 
3 —1 1 —1 1 -1 1 —l H =l 
4 —ё 8 1 1 1 1 一 1 —1 1 
5 1 38 | —0. 092 0.092 1 7 一 上 a a 
6 38 1 1 —0.067 0- 032 1 а 一 1 а 
7 0.067 —1 0.032 一 上 а а 一 1 
8 ё=(4— м3 0/3 0.216 9 8 1 1 
9 = 0.1815 1 А 上 
10 1 1 B 
а= 0. 1925 
| | | B= —0. 2912 
X428 s 一 4 的 35 点 设计 
试验 号 fon n " PETERE = " m” 
4 -1 а а а 1 | f 1 h —1 
6 B $ H -1 13 f 1 一 1 h 
11 8 一 1 8 1 8 1 —1 —1 —1 
10 E 1 一 1 ё š 1 1 —1 ES 
14 1 Y 1 1 2 1 —1 1 —1 
15 1 1 Y 1 9 1 一 1 一 1 1 
8 1 1 1 Y 12 E 1 1 1 
7 £ h =1 1 


根据 :=2,3 HA DD- 最 优 设计 的 试验 点 结构 ,得 到 一 般 的 二 次 饱和 设计 的 方案 如 表 
4-29。 对 于 表 4-29 给 出 的 设计 ,其 信息 年 阵 行列 式 


ACD = 1X 2X QD |= IX GD | (4-59) 
同时 рй) =r AHP GDA D (1) G—2)/Q+1)] 5 
[(#—1)—4GQ—1)G—1)G+z#—2)/Q+1)] (4-60) 
求 式 (4-60) 的 极 大 值 ,只 要 和 解 方程 组 
Ә|х (1/91—0 


e[x (2 |/Ән=0 
ETT ХОП) | 达到 极 大 的 1 和 wz。 上 面 的 方程 组 消去 后 ,得 到 一 个 4 的 9 次 多 项 式 , 这 9 K 
多 项 式 的 9 个 根 , 除 了 3 个 整 根 
Ap 一 一 1 一 2 一 和 一 3 一 2 
外 ,其 他 6 个 根 中 只 有 一 个 在 s EEK, —1<\лу1,у=1›,2,-е уз 内 ,对 SIS IB II A 
的 值 列 在 表 4-50 中 。 从 此 表 可 以 看 出 , 当 m 2,2 时 ,的 值 就 是 二 次 侈 和 DBRT HS 
数值 。 
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R429 :个 因子 的 二 次 饱和 设计 


x X* N Gl n n a E n 

一 个 点 一 1 一 1 一 1 -1 
1 =i —1 一 1 

STAC DERE Lis 1 个 坐标 -1 1 -1 1 
是 一 E € m 
mi -1 1 1 

# 一 ! 一 1 1 

:个 点 (1 个 坐标 是 ps 一 1 个 坐标 E n 1 一 1 
Bb ы m - 
-1 1 # 

a А 一 1 -1 

SOLD A Co PIB AP IT à 1 à -1 
BRED T M u U 
mi 一 1 -1 А 

430 IS HA, „ШШ 
ЕТЕ P a Г яж. Н a 

2 7 0.3944 —0. 1315 9 —0. 9602 0.7544 
3 —0. 2912 0.1925 10 — 0. 9693 0. 7803 
4 —0. 6502 0.4114 11 —0. 9757 0.8022 
5 —0. 8103 0.5355 12 0. 9802 0.8198 
6 —0, 8354 0. 6103 13 — 0. 9836 0. 8346 
7 0. 9242 0, 6772 14 --0. 9862 0, 8471 
8 —0. 9464 0. 7208 15 — 0. 9882 0.8579 


六 、 几 种 常用 的 D- 最 优 混合 设计 表 


表 4-31~ 表 4-35 是 3 个 3 因素 和 2 个 4 因素 的 刀 最 优 设 计 表 ,其 中 两 个 3 
10 次 试验 和 11 次 试验 用 的 ， 而 两 个 4 因素 的 都 是 为 16 次 试验 用 的 。 


表 4-31 3FDE 10 次 DD- 最 优 设计 表 


素 的 分 别 为 


ш = 23 xo kil = 
1 ° о 1.291 1 1 1 

1 о ° —0.136 1 1.174 о 

1 一 1 一 1 0.639 1 — 1174 9 

1 1 一 1 0, 639 1 0 1.174 

1 -1 1 0. 639 1 o —L174 . 


Жаз: 3 因素 URD-ERBTR (一) 


2o = E хь = E 
1 0 ° 2 1 2 2 一 1 
1 с 0 —2 1 -2 —2 一 1 
1 —1.414 —1.414 1 1 ° ° 一 1 
1 1.414 —1.414 1 1 ° о 一 1 
1 —1.414 1.414 1 1 0 o о 
1 1.414 1.414 i 
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32435 SARUKD-RRBTR CO 


ж n m n "m n = E 

1 E 9 2.450 1 0.751 2.108 -1 
1 ° ° -2.450 1 2.106 —0. 751 1 
1 --0. 751 2.106 1 1 = 0.751 —2. 106 1 
1 2.106 0.751 1 —2.108 0.751 一 1 
1 0.181 -2.106 1 1 o o ° 
1 --2.106 一 0.751 1 


4-34 4 因素 16 次 D RIKI (—) 


图 ^ " zs " zo а | = > | = 


1 ° ° 9 1. 7884 1 -1 1 1 0. 644 
1 o 0 0 —).784 1 1 1 1 0. 644 
1 一 1 =1 =] 0.644 1 1.685 0 0 — 0. 908 
1 1 一 1 一 1 0.614 1 — 1.685 0 0 0. 908 
1 一 1 1 =l 0.644 1 ° 1. 635, b = 0. 908 
1 1 1 一 1 0.644 1 0 一 1.635 0 — 0. 908 
1 一 1 1 1 0. 644 1 ° ° 1.685] —0. 908 
1 " -1 1 0.644 i | ° 0 一 1. 685 | 一 0. 908 


94-35 4 因素 16 次 D- 最 优 设计 表 (二 ) 


= а = = | x | E = аз 9 

1 o ° ° 1.7884 1 -1 1 1 0. 644 
1 a 0 o 11.784 上 1 1 1 0.644 
1 -1 -1 一 1 0.644 1 1.6851 0 о —0. 908 
1 1 一 1 一 1 0.644 1 一 1.685| 0 0 一 0. 908 
1 ES 1 -1 9.644 1 ° L| о —0.908 
1 1 1 一 1 0.644 1 ° 一 1.685| 0 —0. 908 
1 m 一 1 1 0.644 1 a ° 1.885| —0. 908 
1 į i 一 1 1 0.644 1 | ° ° —1. 685 | =v. 908 


第 七 节 ”单纯 形 试验 设计 法 


单纯 形 试验 设计 法 是 一 种 序 贯 试验 设计 方法 ， 既 可 用 来 进行 试验 设计 又 可 直接 用 于 试验 
寻 优 ， 它 由 Ernstta1， 在 化 学 计量 学 中 成 为 引 人 注 目的 试验 优化 方法 ，Deming 等 有 详细 综 
3877, 原始 的 简单 单纯 形 法 经 过 许多 改进 ,如 Nelder 等 改进 的 单纯 形 法 ”等 在 化 学 试验 中 应 
REC. 

在 * 维 空间 R' 中 , 单纯 形 是 指 具有 +1 个 顶点 的 多 面体 ， 若 各 个 楼 长 彼此 相等 ， 则 称 为 
正规 单纯 形 。 在 二 维 空间 中 ，* 十 1 一 3， 即 三 角形 是 单纯 形 ， 等 边 三 角形 是 正规 单纯 形 。 单 纯 
形 试验 设计 法 是 以 单纯 形 顶 点 的 坐标 表述 为 试验 各 因素 的 水 平 取 值 ， 在 二 维 空间 中 的 三 角形 
顶点 坐标 (zu zo) 表述 的 是 两 个 因素 的 相应 水 平 。 ш: 个 因素 ， 则 用 ， 维 空间 的 单纯 形 顶 
点 表述 这 * 个 因素 的 不 园 水 平 , 按照 起 始 单纯 形 的 s 十 1 个 顶点 的 坐标 来 安排 ;十 1 个 试验 , R 
后 通过 比较 这 些 试验 结果 ， 淘 涩 其 中 指标 值 最 差 的 试验 点 ， 在 可 能 改进 试验 指标 的 方向 新 增 
一 个 试验 点 ， 再 作 一 次 试验 ， 继 续 单纯 形 搜索 。 

首先 讨论 起 始 单纯 形 的 选取 。 设 л, ш, seo uo шы} ЖК 中 某 一 单纯 形 * 十 1 个 顶点 
的 位 置 矢量 。 拟 用 以 表示 试验 中 个 因素 的 水 平 , Ç s 个 因素 各 取 某 一 起 始 水 平 的 点 为 xo1 这 
个 起 始点 可 根据 化 学 知识 与 经 验 选取 。 对 于 每 一 个 因素 ， 根据 化 学 家 的 经 验 选 定 一 个 步 长 。 步 
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长 代表 的 是 考虑 每 一 因素 的 影响 时 ,从 起 始 水 平移 动 的 幅度 。 例如 选 定 起 始 pH 为 7.0, Me 
择 步 长 为 0 5， 即 是 从 7. 0 出 发 按 0.5 间距 改变 pH 作 试 验 ,经 过 变换 , 可 将 原 为 不 同 数值 与 
单位 的 各 因素 的 步 长 化 为 相同 的 数值 a。 可 以 证 明 , 对 给 定 的 某 一 个 顶点 x, MER а, 按 公式 
(4-61) 取 定 的 单纯 形 是 以 x, 为 顶点 且 棱 长 为 “的 正规 单纯 形 


U = x (4-61а) 
хоб) G=2,3 s +1) (4-61b) 
式 中 ,z(i) 为 ; 维 矢量 
zD =g gpg q] (4-62) 
wh 4-62) % 
B—O Y DIs/G 35] (4-632) 
а= Cs 1—D[a/G / 2 )] (4-68b) 


现 计算 v 55 o, ШШЕ 
Па [P= | о ә |?= I ets) | P= De +p? (4-64) 
式 (4-63a) (4-63b) 代 人 式 (4-64) 后 得 
mw? =G—-1DC/srl1—1[e/G/ 2) 4 CYST 1+ -122[a/G DE 
=[a?/(s?2)]{(s—1) (s +12 FT $1) + 
(s-+1+2¥sF1(s—1)4(s—1)7]} 
—[e/62)]0(G— Ds-2G—1)9 F1 G— D? 
—[v/6G2)]G —54-25— 24-12-55 252-1) 
—[e/62) 25) 
=a 
可 见 这 个 有 s 十 1 ATRA IS RTE АВК I а, Ф и [oi a, T Ж PTR ap p RT A 
WH 


u= [u pos qim tq) 
Um [v giu bem q] 


[LIE 


жаз 计算 起 的 单纯 形 的 5 Quo 。 ”可 见 只 要 根据 经 验 确定 了 一 个 可 行 的 起 始点 o 
6 和 步 长 *， 就 能 开始 试验 。 KF р. о 值 的 选取 
; XL cose ” 可 容 地 根据 式 <4-63) 计算 ， 表 4-36 给 出 了 几 

3 б.943а 0. 236а MAF. 
4 9 9262 0.2194 设 试 验 的 目的 是 搜索 指标 取 值 最 大 的 最 佳 
M i Mni ж. 比较 各 4 的 指标 取 什 , 设 v 是 各 点 中 的 最 


差点 ， 则 进行 反射 ， 去 掉 最 坏 点 u.， 用 其 对 称 
点 作 新 试验 点 。 先 求 去 掉 ww 后 余下 各 点 的 形 心 u, 


Em 
u= (1/0 Yu (4-65) 
= 


се» 


反射 是 按 如 公式 (4-66) 求 发 射 点 и 


u=u BG U, 


) (4-66) 


Hs=2 时 , 在 二 维 平面 上 绘 出 有 关 图 形 , 见 图 4-11。 取 
й=1 进行 反射 得 到 反射 点 ,原始 的 简单 单纯 形 要 求 将 


vr 与 原单 纯 形 中 剩余 的 点 进行 比较 , 找 出 新 的 最 坏 点 u, V7 " 
继续 寺 优 。 如 反射 点 在 新 的 单纯 形 中 本 身 就 是 最 坏 点 ， x7 

则 不 返回 反射 (这 将 形成 死 循环 ) , 而 是 将 新 单纯 形 中 的 > va 

KRAER, RAR ERRARTE СЕЗ 

=1)。 如 反射 点 超出 实验 条 件 可 行 域 范围 ， 即 无 法 按 其 

坐标 所 示 条 件 安排 试验 ,将 此 点 赋予 很 差 的 响应 值 ， 即 

令 其 为 当前 最 差点 。 如 某 一 试验 点 连续 在 s 十 1 个 单纯 = 

形 中 是 保留 点 ， 则 应 予 重复 ,考察 该 点 是 否 确 为 当前 最 нап 单纯 形 的 反射 


佳 点 ,或 是 误差 引起 。 如 确认 该 点 是 当前 最 佳 点 ， 保 留 


该 点 缩小 步 长 继续 进行 单纯 形 寻 优 。 


改进 的 单纯 形 法 能 加 速 最 优 条 件 的 寻找 。 考 庶 到 反射 阐 u 是 最 坏 点 ， 可 能 出 现 以 下 三 种 


情况 。 


第 -种 情况 ,反射 点 凡是 当前 最 佳 点 ， 即 较 原 试 验 点 中 最 佳 点 更 优 。 这 时 自然 考虑 是 否 
继续 沿 由 w 反射 到 wx 的 方向 延伸 。 这 就 是 说 ， 当 ww 是 当前 最 佳 点 ， 进 行 延 伸 到 以 
uU. mud Y, —u,) (4-67) 


在 计算 延伸 点 о, 的 式 (4-67) 中 ，y>1， 称 延伸 系数 C 


扩大 系数 )， 通 常 取 一 2。 如 得 到 的 内 


点 优 于 点 vs REV GRAPHS KAY. и) 构成 新 单纯 形 〈 已 不 是 正规 单纯 形 )， 继 


续 寻 优 。 
第 二 种 情况 ,wu 不 是 当前 最 佳 点 , (AE BR и. LA 


的 最 差点 《 除 u, 以 外 , u, EE u 中 革 


点 寻 )， 这 时 保留 uu， 弃 去 ww， 组 成 新 单纯 形 继续 寻 优 。 


第 三 种 情况 ,uw 较 原单 纯 形 次 差点 差 , 即 暂 不 计 v.s 


以 是 最 差点 。 这 时 考虑 收缩 REE: 


Qu thu 8, Feu. рио, Ia и, Вр uu H (0—0) 


将 二 与 ww 


在 此 7 是 收缩 系数 , 一 般 取 y=1/2. Ши Hu fr, 
保留 ,与 除 u, 以 外 的 原 顶点 组 成 单纯 形 再 寻 优 ， 
如 以 比 凡 差 ,会 去 人 ,缩小 原单 纯 形 继 续 寻 优 . 所 
谓 缩小 单纯 形 ， 是 指 保持 原 最 佳 点 ， 将 楼 长 缩小 
《例如 减 半 ) 形成 单纯 形 。 

DU Ши, BHU ро. UL BEB ol Вр 


u =u БУ) 


Юе, ши Шо. 6, 80и, Уи, 


Hen ЖАЮ. EESE рона Шиа, 3. & 


去 以 ， 保 留 原 最 佳 点 将 楼 长 缩小 的 单纯 形 继续 寻 优 。 


在 s 二 2 的 情况 下 的 反射 、 延 伸 与 收缩 的 情况 示意 于 图 4-12。 


改进 单纯 形 法 的 终止 准则 仍 与 前 述 简单 单纯 形 法 
后 仍 未 被 淘汰 ， 即 应 予 复核 ， 如 被 肯定 是 当前 最 优点 ， 


同 。 在 一 个 点 经 过 = 十 1 次 单纯 形 移动 
缩小 步 长 继续 试验 ， 直 至 继续 缩小 步 


长 已 达到 精度 为 止 。 单 纯 形 试验 守 优 法 一 般 说 来 只 能 找到 局 部 最 优点 ， 因 其 本 质 上 还 只 是 一 
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种 局 部 最 优 方法 。 但 因 其 方便 易 行 ， 在 化 学 研究 中 得 到 了 很 广泛 的 应 用 。 
ЖАЗ 混 料 试验 设计 方法 


一 ,基本 概念 


化 工 、 材 料 、 冶 金 、 食 品 、 精 细 化 工 等 领域 的 产品 大 多 是 几 种 化 学 成 分 混合 后 加 工 制造 
出 来 的 ， 它 们 的 某 项 或 某 几 项 特性 指标 与 混合 成 分 所 占 比例 有 关 。 如 何 确定 各 成 分 在 混 料 
(或 称 配方 ) 中 所 占 比例 ,以 使 我 们 感 兴趣 的 特性 指标 在 一 定 条 件 下 达到 最 优 ， 是 生产 和 科研 
中 的 一 个 重要 问题 。 在 这 一 方面 国内 已 有 一 些 专著 出 版 ， 本 节 只 讨论 一 些 基本 问题 ,读者 可 
参阅 文献 [24]。 在 温 料 问题 中 , 试验 的 响应 值 仅 与 每 种 组 分 的 百分比 有 关 ， 而 与 混 料 的 总 量 
无 关 , 每 种 或 分 所 占 的 百分比 只 能 在 0~1 之 间 变 化 ,其 相 加 总 和 必须 是 l. 01,2, +, 
s) 是 第 ;种 成 分 的 百分比 ， 则 湿 料 问题 要 受 如 下 条 件 限 制 : 

nm0 G1, 2.098) 
Xa-l 


因此 ， 混 料 问 题 的 试验 区 域 是 

Re {rl GH1s2o ss En =l) (4-68) 
EAT Sel 的 限制 , 在 * 个 混 料 变量 GG 一 1, 2, 0 2 中 ,只 有 s 一 1 个 是 独立 的 , 这 
样 的 条 件 限 制 决定 了 在 混 料 设计 中 不 能 采用 一 般 的 :元 4 次 完全 多 项 式 回归 模型 ， 否 则 引起 
ЗН ЕВЗ Ee. 因此 , 混 料 设计 中 常 采用 Scheffe 典型 多 项 式 回归 模型 。 例如 一 般 的 
三 元 二 次 回归 模型 为 


у= 8+ Ms + Уйа, + Уа (4-69) 
而 混 料 回归 设计 中 的 三 分 量 二 хий» 
у= Daat аа (4-70 


它 没有 常数 项 和 平方 项 ， 只 有 一 JRA, ERES. 假定 混 料 回 归 设 计 中 的 三 分 量 二 
次 回归 方程 为 


y= ho Mist Diss а (4-11) 

i) 

由 zi 十 zz 十 zs 一 1 可 得 
Bo= Box i Box Boxe (4-72) 
ala ani) ma xs s (4-73a) 
аі оба: z) 0 Tte Дл (4-73b) 
at= r ( — xa) mas Ta das (4-730) 


将 上 述 式 (4-72) 5R (4-73) КА (4-71) Д, WA 
3 一 (8,4-8,8) 21+ Bot Bet Bn) Tt Bot Bat Ba) + 
(Bu — Bu padaz (Bs Bn — padat Bas Ba Вә) ал: (4-74) 
这 实际 就 是 Scheffe 典型 多 项 式 回归 模型 [ 式 4-70), 
对 于 * 分 量 的 混 料 回归 设计 ， 其 Scheffe 典型 多 项 式 回 妇 模 型 分 别 为 
一 次 式 
у= p (4-75a) 


p 
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二 次 式 
у= 18, + PES (4-75) 
三 次 式 


у= Ms, Улт, c Ya. — z) + ñam, (4-750) 
= 


= £= 5 
在 后 面 将 可 以 看 到 , 当 使 用 单纯 形 格子 点 设计 时 , Scheffe 典 卉 多 项 式 回归 模型 中 回归 系数 的 
基 小 二 乘 估计 的 计算 将 变 得 很 简单 。 

混 料 模型 区 域 的 单纯 形 表示 法 ”在 * 维 试验 空间 中 , s 因子 的 混 料 区 域 中 可 用 G— D 维 
单纯 形 来 表示 。 单纯 形 上 的 点 ,如 其 * 个 坐标 中 有 1 个 坐标 为 !， 其 余 5—1) 个 坐标 为 0, RU 
这 样 的 点 称 为 单纯 形 顶 点 。 因 此 , Æ s 因素 的 混 料 模型 中 . 单纯 形 的 顶点 有 :个 , 下 以 s 二 3 为 
例 来 讨论 单纯 形 上 点 的 坐标 问题 。 

当 s=3 时 ， 其 单纯 形 为 平面 zi 十 zs 十 Ts 二 1 上 的 一 个 等 边 三 角形 [参见 图 4-13 (a)], È 
的 顶点 为 401,0,0),B(0,1,0),C(0,0,1)。 Ж. лола] 的 条 件 限制 下 , 各 分 量 z (i 一 1， 
2.3), 只 能 在 三 角形 ABC 上 取 值 . 为 了 方便 , 在 使 用 时 不 髓 画 出 3 个 坐标 轴 ， 只 画 出 一 个 等 
边 三 角形 就 可 以 了 [参见 图 4-13 (b)]。 对 于 该 三 角形 中 的 任 一 点 已 有 
ЕА'+ЕВ'+ЕС'=1 (4-76) 
这 样 , 就 库 以 把 FFA! 的 长 度 看 成 是 下 点 的 z. 坐标 值 , 把 FB' 和 FC MAE FOR 
Zs 和 rs 坐标 值 ， 即 单纯 形 上 的 点 与 有 序数 (zl, rao z0 之 间 建立 了 一 一 对 应 关系 , 显然, mi， 
т, ху WRN ARIF, 

四 因素 混 料 设计 的 单纯 形 是 一 个 四 面体 [参见 图 4-13 (c)], "ERI 4 个 顶点 分 别 为 4(1， 
0,0,0),B(0,1,0,0),C(0,0,1,0), D(0,0,0,1) , 5j s=3 ЊЕ, IT FEES EXC ems zy zm, 分 别 
OR B BE J IN 80 S389 ^E bs DOE ЗУ AE IESUS RUE ABER Ж. 

用 类 似 的 方法 ,可 建立 s 个 因素 空间 的 混 料 设计 的 正规 单纯 形 坐 标 系 。 


Ey A(1,0,0,0) 
A(1,0,0) A(1,0,0) 
5 
B(0,1,0,0) €. f---------D(0, 0,0, 1) 
ceo N C(0,0,1) 
B(010) B 
= C(0,0,1,0) 


(a) e to) 
BE 4-13 混 料 试验 区 域 


二 、 单 纯 形 格子 点 


对 于 Scheffe 典型 多 项 式 回 归 模 型 ,Scheffe 提出 了 单纯 形 格子 设计 方法 ,这 种 设计 方法 可 
以 保证 设计 点 分 布 均匀 , 且 回 归 系 数 的 计算 变 得 简单 .下面 先 介绍 格子 点 的 概念 和 计算 公式 。 

前 已 述 及 ， 当 :一 3 时 ， 其 单纯 形 是 一 个 边 长 为 1 的 等 边 三 角形 ， 它 的 3 个 顶点 的 全 体 称 
为 一 阶 格子 点 集 ， 记 为 13,1}[ 参 见 图 4 14(a)]。 

将 等 边 三 角形 的 三 边 各 二 等 分 , 则 此 三 角形 的 三 个 顶点 与 三 条 边 的 中 点 [图 4-14 (b)] 的 
全 体 称 为 二 阶 格子 点 集 ， 记 为 13,2}， 其 中 共有 6 个 点 ， 各 点 坐标 参见 表 4-37。 

将 等 边 三 角形 的 三 边 三 等 分 ， 对 应 的 分 点 连 成 与 边 平行 的 直线 ， 参 见 图 4-14 (с), F 
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边 三 角形 上 形成 许多 格子 , 这 些 格子 的 顶点 的 全 体 称 为 三 阶 格子 点 集 , 记 为 {3,3), 其 中 有 10 
个 点 ， 各 点 坐标 示 子 表 4-38。 


xl 
XX 
[^] [3] © ® 
Hel x71 = = 
а) 


237 
(d) 
图 4-14 单纯 形 格子 设计 点 分 布 
表 4-37 单纯 形 格子 (3, 2) 各 点 坐标 
MP = a Гав a ^ n 
1 1 4 1⁄2 "am a 
2 9 1 0 5 1:2 о 1⁄2 
3 0 9 1 6 9 1/2 172 
表 4-38 单纯 形 格子 13，3} 各 点 坐标 
Ae 坐标 РА = 2а Ae 坐标 | a = ES 
1 1 ° 0 6 273 UT 0 13 
z ° 1 0 7 1⁄3 о 273 
3 o ° 1 8 ° 2/% 1/3 
1 2/3 1⁄3 9 i 1/3 273 
5 1⁄3 2/3 9 10 ‚13 1/3 1/3 


将 等 边 三 角形 各 边 a 等 分 ， 类 似 地 可 得 4 阶 格子 点 集 ， 记 为 {3,d}。 

当 5=4 时 ， 类 伏地 可 得 d MRT AR, Aid) TAR 1), {42}, (4,3), Ш 
图 4-14 中 的 《d)、(e)、(f) 所 示 ， 格子 点 集 {4,2) 中 有 10 个 点 ， 各 点 坐标 见 表 4-39， 格 子 
点 集 {4,3} 中 有 20 个 点 ， 各 点 坐标 见 表 4-40, 


RAI 单纯 形 格子 (4.2) 各 点 坐标 


AS 坐标 | a = E = dux 坐标 | un E n E 
1 1 0 à ° 6 | 1⁄2 D] 1⁄2 9 
2 ° 1 ° 0 7 12 n 0 12 
3 9 9 1 9 8 ° 1/2 1/2 5 
4 ° ° 9 1 ° ° 1⁄2 ° 12 
5 1/2 1/2 ° o 10 ° 2 1/2 1⁄2 
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94-40 单纯 形 格 于 (4, 3) 各 点 坐标 


AS AU 

1 | 1 0 0 5 11 ип 273 1/3 0 
2 6 1 0 о 12 ° 1⁄3 2/8 ° 
3 Ü Ü 1 o 13 a 2/3 0 1⁄3 
4 0 0 Ü 1 14 Di 1⁄3 0 2/3 
5 2/3 1/3 D 0° 15 0 2 2/8 1⁄3 
6 1⁄3 2/8 n 0 16 0 Di 1⁄3 2/3 
7 2/3 0 1⁄3 a 17 1/3 123 1/3 0 
8 1⁄4 D 2/3 0 18 DES 13 D из 
9 2/3 о o 1/3 19 1⁄3 9 1/3 1⁄3 
10 1/3 о о 2/3 20 0 1/3 1⁄3 1⁄3 


将 上 述 作法 推广 ,可 做 出 其 他 的 格子 点 集 ,格子 点 集 一 般 地 可 表示 为 {s,d)， RPs 表示 
单纯 形 顶 点 的 个 数 ，d 表示 将 单纯 形 的 边 长 等 分 的 份 数 。 
TRE G—D 维 正规 单纯 形 CH s 个 项 点) d 阶 格子 点 集 {s,d) 中 各 格子 点 的 正规 单 
纯 形 华 标的 一 般 算 法 ， 取 :个 互相 正 交 的 单位 矢量 
&:, 0, 0. +, 0) 
a,:(0, 1, 0, +, 0) 


@,:(0, 0, <s, 1) 
WA s 个 单位 矢量 作为 顶点 围 成 一 个 正规 单纯 形 ， 此 单纯 形 上 的 任 一 点 * 都 可 以 表示 为 
rid iaces, (4-77) 


җир 
ii {ае tis (4-78) 
Has tes +, 1, ARSE 2 的 分 数 时 ， 即 
i adi mad, i =e d 
&2Z20G=1,2,",s) 
ata te La = d 
MER (4-78) 所 确定 的 总 体 就 是 〈: 一 1) 维 正规 单纯 形 的 4 阶 格子 点 集 {5,4}， 也 就 是 说 
&2>0(=1,2,+-,5)\ 
a papper a md ; 
MAR (4-79) 所 确定 的 点 集 实际 有 Ca. ЖШ Este Н soa 中 各 点 的 单纯 形 坐标 
系 的 坐标 。 下面 以 ;一 4 的 情况 为 例 ， 算 出 {4,2)，{4,3} 各 点 的 坐标 。 
CD s=4, d=2, WI A 2 阶 格子 点 集 {4,2} 单纯 形 坐 标 系 的 坐标 算法 : 
4 二 2，a.(i 二 1,2,…,s) 的 取 值 情况 只 有 两 种 ， 即 1 2, 
(D 当 基 个 必 取 2 时， 其 余 的 ajGj=1,2,…,4,j 才 站 都 得 为 堆 ， 则 此 时 有 CI 一 4 个 点 ; 
O Bio 取 1 时 ， 其 余 的 都 得 为 零 ， 则 此 时 有 C? 一 6 A. 
由 此 算得 的 4 维 2 阶 格子 点 集 {4,2}，10 个 单纯 形 坐 标 系 的 坐标 如 表 3-39 所 示 。 
(D s=4，d 一 3， 即 4 维 3 阶 格子 点 集 {4,3} 单纯 形 坐 标 系 的 坐标 算法 : 
8 4=:, aG=1, 2, =, s) 的 取 值 情况 有 3 种 ， 即 1、2 或 3。 
D BRP a MI, HRM a CG— 1.2, 5 4, JAD 都 得 为 零 , 则 此 时 有 CC! 二 4 个 点 ; 


(sd) Aff (4-79) 
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O MAMAS 2, AARIN, HAW а, 都 得 为 零 ， 则 此 时 有 2C4 一 12 个 点 ; 


图 当 某 三 个 a 取 1 时， 剩余 的 为 零 ， 则 此 时 有 C=4 个 点 。 


由 此 算得 的 4 维 3 阶 格子 点 集 !4,3} 的 20 个 单纯 形 坐 标 系 的 坐标 如 表 4-40 所 示 ， 


=. 单纯 形 格子 设计 法 


设 有 :分 量 系 统 , 各 分 量 (0-1,2. 56, 5) MERE RRR Ул =1, “RA 
d 阶 典型 的 Scheffe 多 项 式 回归 模型 时 ， 试 验 点 选 为 1s.d; HCL ,个 档 子 点 ， 这 正好 与 所 采 
用 的 a 阶 典型 的 Scheffe 多 项 式 回归 方程 中 , 待 估计 的 回归 系数 的 个 数 相等 , 故 单纯 形 格子 设 


HERA ЖЕ “ROR” EP MRR. ERR A 


ULT FR MRR д 


数 及 相应 的 典型 的 Scheffe 多 项 式 回归 方程 阶 数 d 之 癌 的 关系 如 表 1-41 所 示 。 


RAN 单纯 形 格子 设计 的 试验 点 数 


点 N BDH PRED 点 ww | иц кейж 
分 量 分 最 ж 
数 M 2 3 4 ж 2 3 4 
3 8$ Í 10 18 5 L z 56 126 
4 10 20 35 8 36 120 330 
15 35 jo | 10 |55 220 715 


前 面 说 过 , 对 于 典型 的 Scheffe 多 项 式 回 归 模型 ， 当 采用 单纯 形 格子 点 设计 时 ,回归 系数 
的 最 小 二 乘 估计 将 变 得 很 简单 ， 这 时 ， 每 个 回归 系数 的 值 只 取 次 于 按 一 定 规律 对 应 的 一 些 格 
子 点 上 的 观察 值 ， 而 与 其 他 设计 点 上 的 观察 值 无 关 ， 各 回归 系数 都 可 以 表示 成 相应 设计 点 上 
观察 值 的 简单 线性 组 合 。 下 面 以 分 量 混 料 设计 的 二 阶 多 项 式 四 时 方程 为 例 ， 说 明 怎样 从 试验 


结果 计算 各 回归 系数 。 

二 阶 多 项 式 回归 方程 典型 Scheffe 形式 为 

y Bon Bas pars + Bz e Biz ri Batas (4-80) 
与 此 相应 ， 单 纯 形 格子 设计 及 试验 结果 见 表 4-42。 
54421 单纯 形 格子 (3. 2) 设计 及 试验 结果 
试验 点 | a = з [meee [ea | < | æ а | 试验 结果 
1 1 0 > | 4 Em 1⁄2 9 Í > 
2 o 1 ° ye 5 1⁄2 0 1⁄2 уз 
0 0 1 ya | 6 0 1/2 1/2 ya 


为 表述 清晰 起 见 ， 各 试验 点 的 观察 值 以 相应 的 下 标 来 表示 ， 例 如 : 
y— x 38 1 而 其 余 分 量 丝 为 零 的 格子 点 的 观察 值 ; 

y z H 1/2, ху 为 1/2， 其 余 分 量 丝 为 零 的 格子 点 的 观察 值 
ya 一 -zx 为 2/13，z, 为 1/3， 其 余 分 量 丝 为 零 的 格子 点 的 观察 值 ; 


Уно. 为 3/4， z, 为 1/4， 其 余 分 量 皆 为 零 的 格子 点 的 观察 值 ， 等 等 。 


对 子 式 〈4-80》 表 示 的 回归 模型 ， 可 容易 地 看 出 
B» 
Ва=4у 20. y) 
写成 一 般 式 ， 有 
B= у, 
Ву=4у 26у)  GEjuj-5b23 
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对 于 -- 般 * 分 量 模型 , 与 二 阶 单 纯 形 格子 设计 相应 的 典型 Scheffe 多 项 式 回归 方程 的 系数 
公式 为 
B= y 
B.,=A4y, —2(y y.) G< psi p= 12500058) 
类 似 地 ，* 分 量 三 阶 单纯 形 格子 设计 相应 的 典型 Scheffe 多 项 式 回归 方程 的 系数 公式 为 
B=» 
By AI уруу) GE jedes) 
Y,474/9(8y4—3y,,— y y 
Bin = 273y. — 21 /A Cy yat 3 Уш Hya К Уны t 9/2 Cy у, yi 
CR 


四 、 单 纯 形 重心 设计 法 


在 单纯 形 格子 设计 中 ， 当 所 采用 的 回归 模型 的 阶 数 大 于 2 时 ， 在 某 些 混 料 中 ， 各 分 量 是 
以 不 相等 的 比例 出 现 的 。 能 否 对 单纯 形 格子 设计 进行 改进 ， 只 考虑 各 成 分 有 等 比例 成 分 的 试 
e 另外 ,单纯 形 格子 设计 虽然 是 侈 和 设计 ， 但 试验 次 数 仍然 很 多 Cha). RE, ERI 
Scheffe 典型 多 项 式 回归 模型 进行 收 造 ， 改 变 为 对 各 分 量 来 说 都 是 对 称 的 。 于 是 ， 提 出 了 单纯 


形 重心 设计 。 
在 单纯 形 重心 设计 中 采用 的 回归 模型 为 

一 次 重心 多 项 式 
у= Ya, (4-812) 

二 次 重心 多 项 式 
y= Ms + Davee, (4-81b) 

= = 

三 次 重心 多 项 式 

y= Br, + Dane, Y naa, (4-810) 
acd Ax) AXE: 


由 上 述 重心 多 项 式 回 归 方程 的 形式 可 以 看 出 , 一 阶 , 二 阶 重心 多 项 式 回归 方程 与 一 阶 、 二 
Wr Scheffe 典型 多 项 式 回归 方程 是 相同 的 。 当 阶 数 大 于 2 时 ， 前 者 较 后 者 减少 了 一 些 乘积 项 ， 
另外 ， 对 于 s 分量 混 料 系统 ， 重 心 多 项 式 回归 方程 的 阶 数 最 高 为 so 

在 单纯 形 重心 设计 中 ， 试 验 点 的 选取 方法 是 取 单 纯 形 顶点 及 它们 的 一 些 重心 点 ， 如 

单纯 形 的 s 个 顶点 : 0,0,0.,0 7 (00,0, D FEA С 个 点 ， 

两 个 项 点 的 重心 点 : (1/2,1/2,0,++,0),++ (000,051 /251/2), SEA C 个 点 。 

三 个 顶点 的 重心 点 : (1/3,1/3,1/3,0,#,0),(1/3,1/3,0,1/3,',0),'+,(0,0,,1/3, 
1/3,1/3), 共 有 CC 个 点 。 

G—1) 个 顶点 的 重心 点 : 01/G—D,1/G—D.1/G—10),,1/6—0),00, 7, (0,1/G— 
D,1/G- D,1/G—1),,1/G-—1) 388 CHC TA. 

s 个 顶点 的 重心 点 ， 0/51/51/5 1/0. HER СЫ PA, 

对 s 二 3， 其 单纯 形 重心 设计 共有 ?个 点 ， 见 表 443 及 图 4-15。 
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94-45 三 分 量 三 阶 单纯 形 重 心 设计 


试验 点 n EI E 试验 结果 
1 I 7b 0 x 
2 ° 1 ° ye 
3 ° ° 1 > 
4 1/2 1/2 0 Уш 
5 1⁄2 9 1⁄2 1 E 
5 0 1⁄2 102 | yn 
T 13 1/3 | 1/3 us 


RRR, mE 


图 4-15 单纯 形 重心 设 计 示意 图 


对 s 一 4, 其 单纯 形 重心 设计 共有 15 个 点 . 见 表 


4-44， 类 似 地 可 以 写 出 204 的 备 阶 单纯 形 重心 设 
计 方 案 。 


容易 看 出 ,对 s 因子 泥 料 设计 系统 ,前 面 所 说 


的 单纯 形 顶 点 及 项 点 的 各 种 恒心 点 总 数 为 


CCH HC 2-1 
ERA s 阶 重心 多 项 式 回归 模型 时 , 应 取 这 全 


部 2 一 1 个 点 作为 成 验 点 。 显 然 ， 单 纯 形 寻 
方案 的 试验 点 数 等 于 相应 的 * 阶 重心 多 项 式 回 归 
方程 中 待 信 系 数 的 个 数 , 故 单纯 形 人 


(4 82) 


Eo gt 


重心 设计 也 是 饱 


和 设计 。 一 、 二 阶 单 纯 形 格子 设计 与 一 、 二 阶 单 纯 
形 重心 设计 相同 , 当 d >2 时 ,对 于 问 阶 多 项 式 回归 


重心 设计 的 试验 点 数 要 少子 单纯 形 格子 设计 的 试验 点 数 ， 且 4 越 大 其 差 


RK. 
#444 由 分 量 四 阶 单纯 形 重心 设计 

EER| s | = | = | = Гашака on | < | = [| = [uuu 
l B 0 о 0 » 75 N Dm o 1⁄2 E 
2 o 1 o 0 ж 10 u | 0 1 2 | 12 ox 
3 [ в 1 ° » 11 1⁄3 pi 1/3 6 ж 
4 ° o 0 1 » 12 13 , L8 0 US | x 
5 1⁄2 1⁄2 0 > 18 1⁄8 D Ms | 13 | э 
6 1⁄2 ° 1/2 ° ye M | 9 1⁄3 1⁄3 13 » 
7 1⁄2 ° ° 1⁄2 | > 15 | 1⁄4 1⁄4 1 4 | vA | оз 
8 e 1/2 1⁄2 0 » 
对 混 料 设计 ,也 可 以 考虑 -最 优 性 问题 , 可 以 证 明 ， 一 - 阶 、 二 阶 单纯 形 格子 设计 及 三 阶 


单纯 形 重 心 设计 是 DD- 最 优 的 ， 而 二 阶 单纯 形 格子 设计 不 是 D-E. 


三 分 量 汪 阶 重心 多 项 式 回归 方程 
у= йж + D Ba, + Buyzizyza 


的 系数 计算 公式 为 


Bus = 27 yu — 12 nat yu ya) 30у Hyt y) 
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E 


B—» 
B; Ay, 77 26 y) 


G< 5íj-1,2,8) 


(4-83) 
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一 般 地 , 对 于 :分 量 混 料 系统 , 采用 * 阶 单 纯 形 重心 试验 设计 方案 时 , 相应 的 4d 阶 重心 多 
项 式 回归 方程 各 回归 系数 按 式 4-8 计算 ， 
Bo = У) (= 17 ey Dr) = 1, Bye) (4-84) 


式 中 “六 一 ,个 成 分 中 基 * 个 的 集合 ， 
(0 7 - KE s 个 成 分 中 取 * 个 的 全 部 C 个 组 合 的 试验 值 的 总 和 。 
例如 ,s 二 4,4 一 4 时 ,四 阶 量 心 多 项 式 回归 方程 为 


4 
` ` 2 Р 
у= 8+ Msz, У) Bento + Bitta, 
= En 


D 


当 采 用 四 阶 单纯 形 重 心 设计 方案 时 ， 上 式 中 各 回归 系数 计算 如 下 
$r—1, Mr=1, AX (4-84) 得 
B= DT y= 1,253.4) 
&r=2, 则 1 二 1、2， 从 式 (4-84) 得 
B,72LC- D *XZ7 y HCH D'" X17 ty, 
=4y,—2(y-+y) G,.=1l,.2,3,4;i<j) 
$4r—3, Wir-l. 2, 3, Mk (4-84) 得 
Ba=3l(—1y 3X BTN yip БС X 2771 Gu yay.) - CO 97 X 17! by 0] 
=? ya 12(y, F ya tyad Gi yy Gub 1,2.8 4L 
Brady е1, 2. з. 4, AR (4-84) 得 7 
Biss m 41) X4 T yia HS DTX (уез уала Бу) 
+(—1)*7*х2* у, yt yt yac yu ун) tH DE у ty bys tye] 
=256бунз» 108 Cras а H hu узн) 32 (у. m yi Буз Буа yn Ya) 
= 40а Фууу) 
以 上 论 及 的 混 料 设计 方法 只 能 说 是 最 基本 的 设计 方法 , 实际 上 , 以 前 讨论 的 均匀 设计 ,也 
可 物 造 出 混 料 设计 的 方案 来 ， 读者 可 参阅 文献 [25] 


SIG ”化 学 中 常用 的 优化 方法 


一 、 基 本 概念 简介 


在 化 学 研究 和 分 析 化 学 中 ， 需 经 常 使 用 最 优化 方法 ， 前 述 的 单纯 形 试验 设计 方法 本 身 就 
是 一 种 最 优化 方法 ， 它 不 但 可 用 于 试验 设计 ， 还 可 用 于 计算 寻 优 ， 即 用 于 多 元 校正 、 多 元 分 
办 、 和 模式 识别 、 化 学 专家 系统 及 化 学 动力 学 参数 辨识 等 领域 ， 可 看 成 是 一 种 通用 的 数学 工 
县 呈 中， 所以， 在 此 对 化 学 中 常用 的 优化 方法 作 简要 的 专门 介绍 。 

在 介绍 化 学 中 常用 优化 方法 之 前 ， 先 讨论 有 关 最 优化 理论 的 一 些 基 本 概念 。 

1. 优化 问题 选 代 算法 的 基本 思想 

在 优化 问题 求解 中 , 常 须 用 到 和 迭代 方法 , 选 代 方法 直接 从 分 析 目标 函数 /Cx) 的 特征 人 手 ， 
构造 一 类 和 逐次 使 目标 函数 值 下 降 的 搜索 。 因 一 般 在 化 学 研究 中 使 用 的 优化 方法 多 由 和 送 代 法 构 
成 ， 对 这 类 方法 的 基本 思路 的 掌握 将 对 理解 具体 算法 带 来 很 大 好 处 ， 所 以 ， 将 对 此 也 作 简要 
介绍 。 

这 类 方法 一 般 由 以 下 四 个 步骤 组 成 : 
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QD 选择 初始 近似 点 x 《自然 是 越 靠 近 最 优点 趣 好 ) 。 
@ 如 已 算出 第 次 近似 点 x”, Axo 还 不 是 在 要 求 的 误差 范围 内 的 最 优 解 . 此 时 可 选择 
一 个 搜索 方向 *， 使 没 s% 方 向 目标 函数 值 下 降 GRRE), BD s" SEE f(x) 的 下 降 
方向 。 
图 由 点 x 中 出 发 HE ;中 方向 作 射 线 ， 在 此 射线 上 ， 定 出 步 长 入 ， 使 所 得 的 点 
go oa? pat 
满足 foo ye fi 
ESRA ET A BOE TUNE fB) FASE. BLA, on? B А, s? JE OR f GO RL 
这 是 单 变量 的 函数 极 小 化 问题 ， 称 为 一 维 搜索 ， 其 表达 式 为 
FEY = foe? БА) e min (x FAs) (4-85) 


D 验证 所 得 新 点 x ' "是 否 达到 要 求 的 精度 e (е BUB EO. Hl 
l| x*7 P —x'^ | < 

或 满足 其 他 类 型 的 终止 标准 . OO RTT APE OS ЖЩ. DL a EORR 0 
点 ， 转 加 继续 进行 搜索 。 
由 上 人 述 计 算计 程 可 以 看 出 ,在 这 样 的 迭代 算法 中 ,搜索 方向 s* 和 步 长 因子 构成 每 一 次 
送 代 的 修正 量 ,它们 是 决定 算法 好 坏 的 最 重要 因素 。 
2， 局 部 最 优 与 全 局 最 优 
dd РОО SUE n 维 欧 氏 空间 R° ARAA, 那么 , 所 谓 无 约束 极 值 (优化 ) 问题 , 是 
要 求 在 R*" 上 求 函 数 f(x) 的 最 小 值 RRK), B 
min f(x) 


re" 


所 谓 约 束 极 值 问题 ， 是 求解 


min f(x) 
тєк" 


H, Еп (х |а, G)2s0.£—1,2,3, m) CR", gi G0. G—1,2.3, 7 ,m) ЖЖП РИ 
条 件 。 

对 于 点 x*" € R", 如 果 不 等 式 A(x") 所 fx) 对 所 有 的 xE R" 都 成 立 , 则 称 点 x" 为 最 优化 问 
题 的 全 局 最 优 解 。 

如 果 存 在 x' 的 某 个 邻 域 V(x" ), 如 果 不 等 式 Fan ) 所 f(x) 对 所 有 的 xEV(x" ) 都 成 立 , 则 
Wax 为 最 优化 问题 的 局 部 最 优 解 。 

3. ВЕ BUERE 

函数 了 (x) 在 给 定点 的 梯度 是 一 向 量 , 它 的 大 小 就 是 函数 在 该 点 的 方向 导数 的 最 大 值 ， Ç 
的 方向 丕 直 于 函数 过 该 点 的 等 值 面 ， 且 指向 函数 增 大 的 方向 ， 一 般 说 来 ， 其 梯度 向 最 可 表 
Ly 


VfG) = [ау Cr) /dr Bf) /dz OF (x) /8x. T (1-86) 
ЕРЕ 
Sos Ff) ӘӘ, Ff) Әл Ae, 
Vfo- e fan fana, FFB с Pfam an| 


Әх) /ax,ex, д#}(х)/Әх„Әх, … — SfG/)0x | 
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二 阶 导数 第 阵 又 称 Hessian ЖЕ, 是 Ge Xn) HE. 它 的 正定 性 (参见 第 十 一 章 ) 是 
判定 函数 是 否 凸 性 的 充 要 条 件 。 如 函数 是 凸 的 ， 则 其 最 优 解 一 定 是 全 局 最 优 甫 。 

4. AMAA 

在 局 部 优化 算法 的 概念 起 着 重要 的 作用 时 ，- - 些 比较 有 效 的 方法 ， 都 是 以 共 轰 方向 为 搜 
索 方向 而 形成 的 。 

ЖА 为 一 个 Go00 WERE. p g 为 两 个 维 向 量 ， 若 

p'Ag=0 

则 称 p、g BL FAKE, MER AHH DERRE, Mp. q PES ВЕ 5. 

ЯЕ К n TARO ШЕЙК л ABB SERED ET ERR 则 最 后 得 到 的 
就 是 它 的 最 优点 。 如 果 一 个 算法 的 搜索 方向 是 互相 共 声 的 。 则 称 为 共 辊 方向 法 ， 以 后 讨论 的 
HERRE, DFP ARERI MA. 


二 ， 局 部 优化 算法 


本 节 讨 论 的 方法 都 是 局 部 最 优化 方法 ， 所 得 的 最 优 解 只 是 局 部 最 优 解 。 局 部 最 优化 方法 
中 如 较 是 否 需 要 对 目标 函数 求 导 来 分 , 可 分 成 两 类 ， 即 一 类 项 要 对 目标 函数 A(x) 进 行 求 导 运 
Jh. 这样 的 方法 包括 梯度 法 、 牛 顿 法 、 共 撤 梯度 法 以 及 变 尺度 法 ， 这 类 方法 充分 利用 了 函数 
的 解析 性 质 ， 它们 的 收敛 速 度 多 数 比 不 用 求 导 的 饮 化 方法 〈 直 接 法 ) 要 快 ;而 另 一 类 则 勿 需 
求 导 , 常 称 直接 法 ,它们 包括 上 节 讨 论 的 单纯 形 法 及 本 节 将 讨 论 的 坐标 轮换 法 和 了 Towell 方法 。 
以 下 我 们 将 分 别 对 这 两 类 局 部 优化 算法 进行 简要 介绍 。 
(一 ) BRE 
EIIT 
梯度 法 或 称 最 速 下 降 法 ) 是 求解 优化 问题 的 一 种 最 古老 、 最 基本 的 算法 。 其 主要 思路 
BRB RE BET EJ RD fe RAR Re, BU 
s= — V Fle) 
至 于 步 长 的 选取 ,可 以 有 不 同 的 方法 ， 一 种 方法 是 任意 取 一 个 为， 使 
fa) AN FOI fe") (4-87) 


dir. PATRAS ARON BRD AG BOR ВИМ (一 维 搜索 Fl 
i, AR 


FAM А VAG тп) AV FO) (4-88) 


一 般 采 用 后 一 种 方法 GR 《4-88)]。 这 种 导 优 方法 的 基本 寻 优 思路 可 由 图 4-16 示意 表 出 。 

2， 基 本 算法 

QD 选择 初始 近似 点 хо ЛОО Е е, ФА 一 0。 

O HEV) 

O # || VF) || se 3t ata” | Ke MEER хе MAARI i Wit 
[rio 

O 进行 一 维 搜索 ， 即 求 

f 9) — AV fa?) -minf a - AV Fe) 
б 4 FQ?) —min£ G7) —AV fa?) HES k — E+1 RO. 
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(=) 牛顿 法 
1， 基 本 思路 
牛顿 法 也 是 求解 优化 问题 的 一 种 最 古老 、 最 基 
本 的 算法 .这 种 算法 虽然 已 应 用 不 多 , 但 它 仍 是 应 
用 较 多 的 变 尺 度 法 的 基础 .其 主要 思路 是 对 梯度 法 
的 搂 索 方向 进行 政 进 , ТИП ЖЕ Н o C — Hr Ж 
矩阵 的 信息 ， 以 加 速 收敛 速度 ， 
s= o V fO] Vf") (4-89) 
НЕФ АЛАКА 
XE mg VT fa) 
(4-90) 
图 4 16 梯度 法 寻 优 示意 图 对 于 一 次 型 日 标 函 数 ,用 牛顿 法 只 须 迁 代 一 次 就 可 
得 到 最 优点 。 
对 于 非 二 次 函数 ， 由 于 它们 在 极 小 点 附近 和 和 二 次 函数 很 接近 ， 使 用 牛顿 法 ， 其 收 化 速度 
也 是 很 快 的 。 但 是 牛顿 法 要 求 初始 点 选 得 比较 好 ， 和 如 离 最 优点 较 远 时 ， 就 容易 发 生 达 代 发 散 
或 收敛 到 非 最 优点 的 情况 。 为 克服 这 一 缺点 , 提出 “阻尼 牛 帧 法 ”实际 上 ,在 牛顿 法 中 步 长 
因子 总 是 取 1， 而 在 阻尼 牛顿 法 中 ， 每 -PERRETH 
к= [у Р) V fet) 


的 一 维 搜索 ， 即 以 选 代 公 式 
хо OAL у]! foe?) 
代替 式 (4-9C)， 其 中 为 使 
РАСУ] а) —minf a АСУР) V fam 

ЮЕ DE Y F СОСНА IU д. ОКО А ARE, LARA. 但 
FUE ЕЕ АО — E SERO РЕНО ШЕ Е, “eet. ЕЕК, REEK 
缺点 。 

2， 基 本 算法 

CD 选择 初始 近似 点 x 及 判别 收敛 的 正 数 <， 令 天 二 0, 

Q H V SO”) 

SB | V fOe | se B xt U He | ес. ИШ IEEE x BORDER TR. ЕЁ 
行 @ 

O HALY aI, HS 

sP = [VILA] VAG) 
O 进行 一 维 搜索 ， 即 求 A 
FOP FAs?) =minf (x is?) 

© FOV АГУ) v faf), FER к= kl, HO, 

(=) HSU BE 

1. 基本 思路 

可 以 证 明 、 对 于 正定 二 次 = 元 函数 ， 如 果 依 次 沿 n MSE aR. ДП 
最 后 得 到 的 就 是 它 的 最 优点 。 所谓 共 罗 梯 度 法 就 是 遵循 这 一 轩 路 而 设计 的 一 种 优化 方法 。 
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对 于 一 个 正定 二 次 # 元 函数 
Хх) = Q/2x Ax FB xc 4-91) 
有 有 
d f(x)/dx=V f(x) — Az—b (4-92) 
Ek, AT LAM E CALOR RESI RIDENS H. 
ШЕШ x, WR PE, B 


ese”) 
然后 从 点 x" 出 发 ， 沿 方向 s" 进 行 一 维 搜索 ， 得 
fx As?) =minf G7 — 24) (4-93) 
并 令 
ха ma А C4 94а) 
а 5 s" ROA 
s LV FAO) Has (4-94b) 


OREL S ORAND 8 s” n h SB A OA EIT I C V FCPS RT s 
线 位 组 合 而 构成, 辐 题 在 于 如 何 确定 v 
PiE sO 5 ORM PER sts 0, Й 


[= у) Бол А80 —0 (4-95) 
解 方程 (4-95) 得 
n=[— VF? TAs TAs] (4-96) 
又 因为 
V fa) Ax? +b 
у) = Ax? Eb 
所 以 


V Fa) — V Fa) A GU) As (4-97) 
并 且 因 为 梯度 方向 相互 正 交 ( 见 图 4-16 和 图 4-17)， 有 
VAV fah) 
于 是 可 得 
uu [ула Р) y fa/ "LV fom v fam] 
[Tf TT ("LV fac V fad 
[улоу лу (= V FG? EV FAM = v fat] 
=[ул MILI SELVF] 
= VFM VFO N 
同 理 可 得 
== || V fr | 2⁄/ Il v fot 1? 
PORT GBI ERT 9, SP, ry DT. 
YTRE ІЕЕ OI «HD SE ОГА, 但 却 不 能 像 二 次 正定 函数 那样 
具有 良好 的 有 限 步 的 收敛 性 。 
КҖ ЕНШЕ Flether-Reeve ЗЕ ЖЛ, 其 基本 思路 示意 图 示 于 图 4-17. 
2. 基本 算法 
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(D 选择 初始 近似 点 x° BA UR ER, Ç 
k =o, 
DIEVS, Ж 7 V IE) 
然后 从 点 xO Be RIT SEAT RG 
FO + Ae) min frt — 26) 


f(x)=C 


并 令 
图 4-17 共 思 梯度 法 搜索 方向 示意 图 x Da s 
G # | VFO) | xe R | х0 90 | е, BU B LE E AR x? BIOS BOR B E o8 HJ E 
ШО] 
© HR a NV LPO p p Осе) PHS 
к DV ft?) ! 
© 进行 一 维 搜索 ， 即 求 A 
FAP HAs) = min fe aso 
图 Fx Hx! PEs”, HA R-1 k, HO. 
《四 ) 变 尺度 法 
1， 基 本 思路 
变 尺 度 法 可 看 成 是 柳 度 法 和 牛顿 法 的 一 种 推广 ， 实 因 梯度 法 和 牛顿 法 的 迭代 公式 可 统一 
地 表示 为 
rx АНУ) (4-98) 
EA (4-98) P, WRH =I, WAR: BS НОУ, Жа 
顿 法 。 在 此 , HU Xn) MER, ШИ Ну fO) =e, Bn 和 中 可 使 负 梯 度 方向 旋转 
一 个 角度 ， 所 以 它 又 被 称 为 旋转 矩阵 。 如 前 所 述 ， 梯 度 法 收 伍 太 慢 : 牛顿 法 要 计算 二 阶 导数 
矩阵 和 矩阵 求 逆 , THER. LIEGE ih. 这 一 点 是 令 人 感 兴趣 的 , 如 HH” 的 选取 不 需要 
WHOM FRA ASP ORD, 而 又 能 通 近 它 , WAHA (4-98) 确定 的 算法 可 能 收敛 得 快 。 
变 尺 度 法 的 基本 思路 就 是 利用 式 (4-98) 作 为 从 代 公 式 ,矩阵 如 “是 在 选 代 过 程 中 逐步 产生 的 ， 
并 且 它 能 较 好 地 逼近 /Xx) 的 二 阶 导数 矩阵 的 逆 答 阵 。 因 这 类 方法 的 搜索 方向 是 在 HO 度量 意 
义 下 的 负 梯 度 方向 ， 而 在 计算 过 程 中 ，* 又 是 不 断 变 化 的 ， 故 有 变 尺 度 法 之 称 。 
变 尺度 法 有 多 种 , 目前 用 得 较 多 的 是 DFP 法 (由 Davidon-Fletcher-Powell 提出 ) 和 BFGS 
法 (由 Broyden-Fletcher-Goldfarb-Shanno ЖЩ), 下 面 主要 介绍 DFP GOR H^38 EZ RHE 
本 思想 。 
对 于 一 个 正定 二 次 = 元 函数 ，Fz) 一 (172)xM4x 十 BY 十 c, 先 取 初始 旋转 矩阵 Н HER 
一 个 阶 对 称 正定 矩阵 ,例如 HO = 1G Ra x7 
sD go y ft) 
ЭРА x, DORM ARIE EAL HO, TE 
sP=— HOF f 
МЕ sO Ss HARM, AT H 必须 满足 
s(P AsO = — V ОУН РАБ =0 (4-99) 
由 式 (4-99) 可 知 , ТЕЕ HOAs =s, WY (4-99) 必然 成 立 。 基 于 此 ， 可 构造 五” 
的 递 推 求法 如 下 。 
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i 
Ax mato gO = Ase (4-100) 
Ag? — V f(x 19) y fle АО Hx) ALAS? (4-101) 
SRP, R=], 2, 5 n. 
BH? 与 及 "有 递 推 关系 
HO =H JAHH 
根据 HOAs? = sO WM, RU ESR AN? БУЙ E 
AH® Ag = HV As? 
考虑 到 式 4-16) Mk 4-17, WE EB S E 
AH DAS? AH Ag” / = m HD AST ms EHP A= DE? AC H Sg" A. 


BB 
АН bg — Ax —H dg? (4-102) 
由 此 可 以 设想 AHW" 的 一 种 比较 简单 的 形式 为 
АН Ако 097 HO Ag" [w (4-103) 


RP, йй» EE. HE (4103) RAR (4-102) 得 
Ax [gu JAg Hg” (wT Ag? — Ax? - HO ag 
也 就 是 说 ， 应 使 


[ko Pag? = [w Ag 一 1 (4-104) 

考虑 到 AH" 应 为 对 称 阵 ， 最 简单 的 办 法 就 是 取 
Га ]=m A It (4-105) 
w? = HU Ag (4-106) 


将 式 (4-105) 和 式 (4-106) RAR (4-104) 得 
piar Fae? = [HO dg” TAg =] 
E [Az Tag "BUR CHP ag? T'Ag" Ж РЕ, WE 
m=1/{LAr Tog?) -1/ (Ag? Tax] 
8 - 1/ EH Ag Tog} 
于 是 得 到 
AH — as [q ] HVAg LWT 
SAO [s AD] — H Ag? (EHO Ag T 
Ax[Ax?] ноде [аво [Bo] 
C[Ag"TAxX? — [H dg? Pag 
Ax? [Axt] AH? Ag? (Ag? THY 
CIAg?TAxU [Ag D THO Ag 


从 而 可 得 

HO = gO HAP Ax TALA] Aro ) —H Ag? [Ag " THO [ag THO Ag”) 
一 般 有 

Hé» — g L Ayn [Ax ? T/ (fag? TAx'? ) —H'? de (ag? TH /([ag TH" dg} 
ОЕК READER, MPRA EE EIN. 

2， 基 本 算法 

CD 选择 初始 近似 点 x "及 判别 收敛 的 正 数 s。， 令 下 和 二 0, 
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ж TF) se Xx lat ”—х'# | Se. ДОРЕ К, x 外 即 为 所 求 的 解 ， DUE 
FS 
9 НТ, Бет 
P 559 = Нуу) 
© 进行 一 维 搜索 ， 即 求 X 
fx mA) =minf (x At) 
Q Sx Vax LA e 
Op EE Vf GU) | <a R x Pe | <e,, TUR, хато Be ВОК ВО, Т 
则 ， 当 =n 时 ， Ф = x, £9. WERE. > 
Ax mto ue 
Ag? = у FE PIA TF) 
计算 
HEV B® + dx? [axt ТТА Tax") HP Ag" Ag" TH / (Глю HP Ag] 
@ 52-211, KO, 
CH) 坐标 轮换 法 
上 述 介绍 的 方法 部 需 对 目标 函数 进行 求 导 运 算 ， 如 当 目 标 函 数 的 解析 表达 式 十 分 复杂 或 
写 不 出 其 具体 表达 式 的 导数 形式 时 ， 就 无 法 使 用 上 述 方法 。 此 时 可 使 用 本 节 及 下 一 节 将 介绍 
的 方法 或 以 前 介绍 的 单纯 形 法 来 进行 寻 优 。 
1， 基 本 思路 
对 于 ? 维 实数 空间 的 目标 函数 GO 本 法 的 基本 电路 是 依次 沿 其 = 个 坐标 辆 方向 进行 一 
维 寻 优 ， 经 多 次 循环 选 代 后 以 达到 最 优 解 。 
设 维 坐标 轴 方 向 (坐标 轴 的 单位 向 量 ) 为 
e®™=[1,0,0, 0] 
#'®=[0,1,0.-.0] 
e? —[0,0,1,-,0] 


e77? 5 [0,0, 7.1.07 
e" —[0.0.--,0,1T 
为 了 简便 ， 以 后 表示 为 
e?- [00.1 OT i—1.2,3, in 
2， 基 本 算法 
D 选择 初始 近似 点 * "及 判别 收敛 的 正 数 s。， 令 天 一 1， 
© 沿 方向 e 中 进行 一 维 搜 索 ， 得 
FAP EA P) =minfla U Eje) 
并 令 
х©=х° 0-де 
Э ASIE UB kn. ал, WHO; Xin 时 ， 则 令 夺 和 二 4 二 1， 转 图。 
@ 检验 是 否 满 足 收敛 性 准则 ， 即 
йх®—х®-> | e, 车 满足 判别 标准 , 则 停止 选 代 , х OR, Ux x, 
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k=1, HQ, 

此 法 简单 易 懂 ， 但 收敛 速度 是 不 快 的 。 

(A) Powell 法 

1， 基 本 思路 

Powell 法 又 称 方向 加 速 法 , 其 基本 思路 是 利用 逐次 构造 共 范 方向 , 并 以 此 来 加 速 收 敛 , 故 
有 方向 加 速 法 之 称 。Poweil 法 构 造 共 孝 方向 勿 需 计 算 目 标 函 数 的 导数 ,这 是 该 法 的 一 个 显著 
性 优点 。 

2， 基 本 算法 

首先 依 坐 标 轮换 法 的 思路 ， 对 个 互相 正 交 的 单位 矢量 e — [0,01 ON (一 1,2， 
3，…",7) 寻 优 ， 以 得 到 最 优点 的 一 个 初始 近似 点 Y  。 令 一 0 


O41 
加 HE A. 使 
FR, As) m min f Gr" +48") 
并 令 


x= r As” 
@ HE SEIS, Bin. MEO: Picat, WE +1, KO 
DR Ashe 


FL + agg 0] min Les? АА a2] 


并 令 
х = БА (х) 
@ 计算 
JG y— f(x) = max [А00] 
以 确定 参数 m 
@## 
dar ALF o - FOR VF?) = FP TT 
RIS 
gD ag G=1,2 en) 
s. BMS | 
str? ag? G—1,2,.m—1) 
smog G—m,2—1) 
gir a oa) teat? | 
LIUM 
@ 检验 是 否 满足 收敛 性 准则 , 即 
| x х0 | <s, 若 满足 判别 标准 , 则 停止 迭代 ,ze 即 为 所 求 的 解 ,否则 
A а-о Qu) 
令 XP Sa 
FOE?) =F) 
k=k+1 


RO. 
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在 此 讨论 的 算法 是 所 谓 修改 的 Powell 方法 , 实际 上 . 修改 的 Powel 方法 也 有 多 种 ，F 面 
介绍 的 是 Sargent 修改 方法 。 


三 、 全 局 优化 算法 


在 化 学 研究 的 实践 中 ， 因 所 研究 的 对 象 千变万化 ， 很 多 问题 的 目标 函数 非常 复杂 
还 有 很 多 问题 根本 就 没有 现存 数学 模型 ， 本 质 上 应 属于 全 局 最 优 问 题 ， 如 简单 采用 上 述 方 法 
时 就 很 难 奏效 了 ， 由 于 工程 数学 和 计算 机 科学 的 飞速 发 展 ， 近 年 来 消 现 了 很 多 有 效 的 多 局 最 
优 新 算法 ， 这些 算法 的 显著 特点 在 于 它们 大 都 跳出 了 局 部 最 优 的 框框 ， 故 很 快 在 化 学 计量 学 
中 得 到 了 广泛 的 应 用 ， 而 且 成 为 化 学 计量 学 近年 来 研究 的 一 个 热点 。 在 此 将 对 它们 作 专门 的 
介绍 。 在 这 些 新 近 满 现 的 全 局 优化 方法 中 ， 对 化 学 影响 最 大 的 应 数 模 把 自然 机 理 的 模拟 退火 
法 co- 习 和 遗传 算法 Cs-54， 及 由 我 国 数学 家 提出 的 基于 数论 的 优化 方法 2 也 将 在 此 作出 
fef. 
(一 ) 模拟 退火 
1， 基 本 概念 
1982 年 ,Kirkpatric 等 将 退火 思想 引入 组 合 优化 领域 ,提出 一 种 解 大 规模 组 合 优化 问题 的 
有 效 近似 算法 一 模拟 退火 算法 《Simulated annealing algorithm), 它 源 于 对 团体 退火 过 程 的 
模拟 ， 采 用 Metropolis 接受 准则 ， 并 用 一 组 称 为 冷却 进度 表 的 参数 控制 算法 进程 ， 使 算法 在 
多 项 式 时 间 里 给 出 一 个 近似 的 全 局 最 优 解 。 可 以 这 人 么 说 ， 固 体 退 火 过 程 的 物理 和 统计 性 质 是 
模拟 退火 算法 的 基础 背景 ; Metropolis 接受 准则 使 算法 具有 跳 离 局 部 最 优 的 机 制 ; 面 冷却 进度 
表 的 合理 选择 蚌 算法 成 功 的 重要 前 提 。 
固体 在 恒定 温度 下 达到 热平衡 的 退火 过 程 , 其 统计 性 质 可 用 Monte Carlo 方法 进行 模拟 ， 
Monte Carlo 方法 的 特点 是 算法 简单 , 但 必须 大 量 采 样 才 能 得 到 比较 精确 的 结 淋 , РЧ ПЯ 
很 大 。1953 年 ，Metropolis 等 提出 重要 人 性 采样 法 ,他 们 用 下 述 方法 产生 固体 的 状态 序列 : 
先 给 定 以 粒子 想 对 位 置 表征 的 初始 状态 i， 作为 固体 的 当前 状态 ， 该 状态 的 能 量 是 EL Ж 
后 用 摄 动 装置 使 随机 选取 的 某 个 粒子 的 位 移 随 机 地 产生 一 微小 变化 , 得 到 一 个 新 状态 j, 新 状 
态 的 能 量 是 ES WRRVEM EF,<<E,， 则 该 新 状态 就 作为 “重要 ”状态 ,如 果 E E, WA 
虑 到 热 运 动 的 影响 ,该 新 状态 是 否 为 “重要 ”状态 , 要 依据 固体 处 于 该 状态 的 几率 来 判断 。 H 
热力 学 的 知识 可 知 、 固 体 处 子 状态 г 和 > 的 几率 的 比值 等 于 相应 Boltzmann 因子 的 比值 ， 即 
р=ехр[ (E, — EJ /&T? (4-107) 
式 中 ,天 为 Boltzmann Ж, T 为 热力 学 湿度。 此 几率 为 一 个 小 于 1 的 正 实数 。 用 随机 数 发 生 
器 产生 一 个 [0,1) ERRORS. E 6>>e， 则 新 状态 7 可 作为 重要 状态 ， 否 则 会 去 - 
若 新 状态 j 是 重要 状态 ,就 以 了 取代 ; 成 为 当前 状态 , 否则 仍 以 i 为 当前 状态 , 再 重复 以 
上 新 状态 的 产生 过 程 。 在 大 量 迁 移 后 ， 系 统 趋 于 能 量 较 低 的 平衡 状态 ， 固 体 状态 的 概率 分 布 
ЖЕР Gibbs 正则 分 布 。 
从 以 上 讨论 可 知 ， 高 温 下 可 接受 与 当前 状态 能 差 较 大 的 新 状态 为 重要 状态 ， 面 在 低温 下 
只 能 接受 与 当前 状态 能 差 较 小 的 新 状态 为 重要 状态 ,这 与 不 同 温 度 下 热 运 动 的 影响 完全 一 致 。 
EAN DA Tad. RARER EE 的 新 状态 了 。 
上 述 接受 新 状态 的 准则 称 为 Metropolis 准则 ， 相 应 的 算法 称 为 Metropolis 算法 ， 这 种 算 
法 的 计算 量 将 显著 减少 。 
设 一 个 优化 问题 的 一 个 解 宇 及 其 目标 函数 /4z) 分 别 与 一 个 微观 状态 7 RAER E 等 价 ， 
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令 随 算法 进程 递减 其 值 的 控制 参数 + 担当 固体 退火 过 程 的 绝对 温度 本 的 角色 。 则 对 于 控制 参 
Bi 的 每 一 取 值 ， 算 法 持续 进行 “产生 新 解 ”判断 一 接受 / 合 弃 ”的 迭代 过 程 就 对 应 郑 固 体 在 
某 一 恒定 温度 下 趋 于 热平衡 的 过 程 ， 也 就 是 执行 了 一 次 Metropolis 算法 。 与 Metropolis 算法 
从 某 一 初始 状态 出 发 ， 通 过 计算 机 的 时 间 演 化 过 程 . 求 出 系统 最 终 达 到 的 状态 相似 ， 模 拟 退 
火 算 法 从 某 个 初始 解 出 发 ， 经 过 大 量 解 的 变换 后 ， 可 以 求 得 给 定 控制 参数 值 时 优化 问题 的 相 
对 最 优 解 ， 然 后 减 小 控制 参数 上 ИНИ. 重复 执行 Metropolis 算法 , 就 可 以 在 控制 参数 : ATE 
时 ， 最 终 求 得 优化 问题 的 整体 最 优 解 。 由 于 固体 退火 必须 “徐徐 ”降温 才能 使 固体 在 每 一 湿 
度 下 都 达到 平衡 状态 ， 最 终 趋 于 能 量 最 小 的 基态 ， 控 制 参 数 的 值 也 必须 缓慢 衰减 ， 才 能 确保 
模拟 退火 算法 最 终 趋 于 优化 问题 的 整体 最 优 解 。 

模拟 退火 算法 用 Metropolis 算法 产生 优化 问题 解 的 序列 , 并 由 与 Metropolis 准则 对 应 的 
转移 概率 p 


ваа p= |! FAS) (4-108) 
exp{Lf@—-SP ye} Fio) 

ffi xE АЕ V. p ELI /的 转移 , R 04-108) 中 的 :为 控制 参数 。 开 始 可 让 4 А 
较 大 的 值 “ 与 固体 的 熔 解 温度 相对 应 )， 在 进行 足够 多 的 转移 后 ， 缓慢 减 小 * 的 值 ( 与 徐徐 降 
漫 相对 应 )， 如 此 重复 ， 直 至 满足 某 个 停止 准则 时 算法 终止 。 因 此 ， 模拟 退火 算法 可 视 为 递减 
控制 参数 时 Metropolis 算法 的 选 代 。 可 以 证 明 ， 当 寻 优 遵循 此 通 火 过 程 来 进行 ， 只 要 在 过 程 
的 控制 参数 满足 一 定 条 件 时 ， 描 述 为 有 限 非 齐 次 马尔 科 夫 链 的 模拟 通 火 算法 ， 将 收 伍 于 整体 
BARROS, 

在 介绍 模拟 退火 算法 之 前 ， 先 介绍 一 下 邻 域 结 构 与 局 部 搜索 的 概念 。 

G) 邻 域 结构 对 于 属于 解 空间 S 的 每 一 个 解 ， 有 一 个 解 的 集合 S, 5,5, RERE 
菜 种 意义 上 是 “邻近 ”i 的 ， 集 合 S 称 为 i 的 邻 域 ， 每 个 jE 5, 称 为 ;的 一 个 邻近 解 。 

(2) 局 部 搜索 算法 ”局 部 搜索 算法 是 从 一 个 初始 解 ES 开始 ， 然 后 运用 一 个 解 产生 器 ， 
持续 地 在 解 ;( 称 为 当前 解 ) 的 邻 域 5, 中 搜索 比 i 更 优 的 解 ， 若 找到 比 ; 更 优 的 解 ， 就 用 这 个 
解 取代 i;， 成 为 当前 解 ， 再 对 当前 解 的 邻 域 进行 搜索 ; 否则 ， 终 止 局 部 搜索 。 

2， 基 本 算法 

设 存 在 邻 域 结 构 和 可 能 解 产生 器 ， 再 设 n 表示 Metropolis AEW k KERNEIS K: 
的 值 , Le 表示 Metropolis 算法 第 上 次 迁 代 时 产生 的 变换 个 数 ， 则 模拟 退火 算法 可 也 下 列 步 枝 
组 成 : 

D 初始 化 : 设 定 初始 解 pm、 初始 控制 参数 to 及 初始 变换 个 数 L. 

@ 2=0 

OAIR Lo PETERR G2 L2 

DUR SGSI Mi e- А. BHR: 

PGD expli РС РО] 

产生 60,1) 的 随机 数 > 

WR pGO>r, WEET 产 解 ， 用 于 下 一 步 搜索 ， 

®k=k+1 

© EFF Lo PEP 68 у= 1,2, La) 

CD 确定 下 一 步 的 控制 参数 六 

如 果 所 得 的 当前 解 已 满足 某 一 终止 标准 ， 则 停 正 计算 ， 否 则 转 @。 
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切 相关 , HF RA. 控制 参数 和 用 于 邻 域 搜索 的 可 能 解 集 的 大 小 L 都 会 不 同 . 这 ~ 
点 是 模拟 退火 算法 不 同 于 经 典 优化 算法 的 重要 标志 ， 回 时 也 给 模拟 退火 算法 留 下 了 广阔 发 挥 
的 天 地 。 总 的 说 来 ,一 系列 的 控制 参数 4 的 确定 对 模拟 退火 算法 是 至 关 重 要 的 ， 在 模拟 退火 
算法 中 ， 它 有 一 个 特殊 的 名 称 ， 称 为 冷却 进度 表 。 一 般 说 来 ， 较 好 的 冷却 进度 表 将 得 到 较 好 
的 结果 。 这 是 因为 , 模拟 退火 算法 的 跳出 局 部 最 优 的 机 制 就 完全 是 由 Metropolis 的 按 概率 接 
受 新 状态 的 准则 所 提供 的 。 

(二 ) 遗传 算法 

1， 基 本 概念 

遗传 算法 最 早 由 Holland” + 20 世纪 60 年 代 创建 , 经 过 不 断 发 展 , 近年 来 逐渐 引起 化 学 
计量 学 家 们 的 重视 ， 被 广泛 用 于 解决 化 学 上 的 难题 。 遗传 算法 是 一 种 用 计算 机 模拟 生物 自然 
进化 过 程 搜索 最 优 解 的 方法 。 它 是 受 达尔 文 进化 论 的 启发 而 产生 的 。 自 然 界 生物 体 通过 自身 
的 演化 就 能 很 好 地 适应 环境 , 使 问题 得 到 完美 的 解决 , 这 种 才能 让 最 好 的 计算 机 也 相形 见 拙 ， 
大 多 数 生 物 是 通过 自然 选择 和 有 性 生殖 这 两 种 基本 过 程 进行 演化 的 。 自 然 选 择 决 定 了 群体 中 
哪些 个 体能 够 存活 并 繁殖 ， 有 性 生殖 保证 了 后 代 基 因 中 的 混合 和 重组 . 比 起 单 性 牛 殖 的 简单 
基因 拷贝 产生 的 后 代 ，、 有 性 生殖 后 代 进化 快 得 多 。 自 然 选择 的 原则 是 适应 者 生存 ,不 适应 者 
淘汰 。 具 体 地 说 ， 遗 传 算法 是 通过 类 比 上 述 过 程 而 产生 的 -种 概率 搜索 算法 ， 它 是 利用 某 种 
编码 技术 作用 于 称 为 染色 体 的 数 串 ,其 基本 思路 是 偿 拟 由 这 些 数 串 组 成 的 群体 的 进化 过 程 。 遗 
传 算法 通过 有 组 织 地 然而 是 随机 的 信息 交换 来 重新 结合 那些 适应 性 好 的 串 ， 在 每 -` 代 中 ， 利 
用 上 一 代 串 结构 中 适应 性 好 的 位 和 段 来 生成 一 个 新 的 串 的 群体 ; 此外， 偶尔 也 要 在 串 结构 中 
尝试 用 新 的 位 和 段 来 替代 原来 的 部 分 。 遗传 算法 是 一 类 随机 算法 , 但 它 不 是 简单 随机 走动 , 它 
可 以 有 效 地 利用 已 有 信息 来 搜寻 有 希望 改善 解 质量 的 串 。 类 做 于 自然 进化 ， 遗 传 算法 通过 作 
用 于 染色 体 上 的 基因 ， 寻 找 好 的 染色 体 来 求解 问题 ， 与 自然 界 相 似 ， 人 遗传 算法 对 求解 问题 的 
本 身 一 无 所 知 ， 它 所 需要 的 仅 是 对 算法 产生 的 每 个 染色 体 进行 评价 ， 并 基于 适应 值 来 选择 染 
色 体 ， 使 适应 性 好 的 染色 体 比 适应 性 差 的 染色 体 有 更 多 的 繁殖 机 会 。 

遗传 算法 利用 简单 的 编码 技术 和 繁殖 机 制 来 表现 复 条 的 现象 ,从 而 解决 非常 困难 的 问题 。 
特别 是 由 于 它 椒 受 搜索 空间 的 限制 性 假设 的 约束 ， 不 必要 求 诸 如 连续 性 、 导 数 存在 和 单 峰 等 
假设 ,以 及 其 固有 的 并 行 性 ,使 它 在 化 学 中 的 应 用 前 景 正如 Lucasius H Kateman HAN. R 
有 相当 大 的 潜力 。 

遗传 算法 的 过 程 可 概括 为 5 个 基本 步骤 : O 按 设 定 的 规模 产生 第 一 代 群 体 。 群体 中 每 条 
桨 色 体 的 长 度 由 所 需 优 化 的 参数 的 个 数 决 定 . © 评价 染色 体 的 适应 性 。 通 过 一 定 的 方式 将 每 
条 染色 体 中 的 参数 值 代 人 所 求 日 标 函数 中 ， 求 出 对 应 函数 值 。 D 将 目标 函数 值 经 过 转换 ， 从 
而 得 出 染色 体 的 适应 性 优 劣 。 @ E EROR N (Ж. 每 次 随机 地 从 母 代 染 色 体 中 选 出 两 条 
染色 体 ， 随 机 地 交换 它们 某 些 对 应 位 置 上 的 数 段 ， 从 而 产生 下 一 代 的 闭 个 体 ， 在 选 繁 代 染 色 
体 的 过 程 中 . 每 条 染色 体 被 选中 的 概率 与 其 适应 性 成 正比 。 变异 。 按 一 定 概 率 随机 地 对 染 
色 体 上 的 基因 进行 变异 ， 由 此 可 以 产生 一 些 新 的 个 体 。 整 个 算法 在 第 2 步 和 5 步 之 间 循 环 。 

与 前 述 的 模拟 退火 算法 类 似 , 遗传 算法 的 方法 本 身 只 能 提供 -个 框 保 , 在 解决 问题 时 , 需 
密切 依赖 于 它 自 身 以 外 的 过 程 ， 即 必须 与 具体 的 问题 结合 在 一 起 ， 经 过 精心 设计 ， 对 应 用 到 
的 特殊 问题 中 的 特定 域 的 表示 和 专门 知识 加 以 充分 利用 。 目 前 ， 通 过 一 些 化 学 计量 学 家 的 开 
拓 性 工作 ,遗传 算法 已 开始 被 构造 用 于 解决 各 种 化 学 上 的 优化 问题 .Lucasius MKateman "用 
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遗传 算法 进行 波长 点 的 选择 。 在 问 时 测定 4 种 RNA PRERE. 由 于 它们 的 光谱 相似 ， 需 对 
测定 波长 进行 优化 选择 。 文 献 [41] 用 光谱 条 件数 作为 优化 目标 函数 ， 用 0、1 编码 的 染色 体 
表示 波长 点 的 选择 方案 ,在 36 个 波长 点 中 找 出 6 个 最 佳 点 .Fontain[5] 则 将 遗传 算法 用 于 寻找 
有 机 物 同 分 异 构 体 .将 各 个 原子 的 标号 编码 为 染色 体 ,优化 的 日 标 函 数 为 最 小 化 学 距离 (mini- 
mum chenrcal distance), 使 化 学 距离 什 最 小 的 结构 即 为 最 可 能 的 同 分 异 构 体 。 计算 结果 与 实 
际 化 学 反应 产物 一 致 另外, 还 有 Hibbertc: 用 壮 传 算法 计算 化 学 动力 学 参数 ;Leardi 等 人 
用 遗传 算法 进行 特征 选择 ; Brown5s' 等 人 将 此 算法 用 于 有 机 化 合 物 分 子 结 构 的 比较 和 检索 ， 
Lucasiuscrl 等 用 此 算法 进行 聚 类 分 析 ; PE, MARE EA 则 就 数值 遗传 算法 进行 了 有 益 
探讨 。 以 上 方法 在 染色 体 的 编码 表示 、 目 标明 数 的 构造 、 交 义 、 变 异 的 操作 及 限制 条 件 等 各 
个 方面 都 大 不 相同 ， 但 所 有 的 作者 都 力图 找到 最 适合 于 解决 该 具体 问题 的 方法 。 由 于 在 化 学 
领域 引入 遗传 算法 的 时 间 尚 短 ， 自 前 仍 有 许多 工作 需要 做 。 

2， 基 本 算法 

妈 前 所 述 ， 遗 传 算法 通过 模拟 自然 界 生物 “遗传 ~ 变异 ~ 适 者 生存 ”的 进化 过 程 ， 对 优 
化 空间 进行 贿 机 搜索 ， 队 而 得 到 全 局 最 优 解数 值 遗 传 算法 是 将 待 优化 的 各 个 参数 排列 在 一 
起 ， 当 作 一 -条 染色 体 ， 每 个 参数 即 为 染色 体 中 的 遗传 基因 。 根 据 染 色 体 对 环境 的 适应 性 《 即 
其 目标 函数 值 的 一 个 转换 指标 )， 通 过 各 种 遗传 操作 控制 其 繁殖 情况 ,淘汰 差 的 ,保留 好 的 ， 
最 终 得 到 最 好 的 染色 体 ， 亦 即 全 局 最 优点 。 算法 可 用 五 个 步 又 描述 如 下 。 

CD 个 体 初 始 化 ”用 待 优化 的 指标 组 成 染色 体 ， 如 rines 第 一 代 个 体 由 20 Ж 
色 体 组 成 ， 染 色 体 中 各 参数 值 可 在 各 自 的 约 东 区 间 内 任 取 ; 

z. =limit G) xr 
R, zz; 为 第 j 条 染色 体 中 第 i 个 参数 ,limit(i) 为 它 的 约束 范围 ,r 为 [0,1) 之 闻 均 名 分 布 的 
ш. 

(D RARER SRR Deb 9:5 ЖИНА НИШ AGO P, RAM R 
值 ， 若 有 两 条 或 多 条 完全 相同 的 染色 体 ， 保 留 一 条 不 变 ， 其 余 重新 赋值 。 

(3) 将 目标 函数 转换 为 适应 性 ”染色体 优 劣 需 通 过 适应 性 来 评价 。 适 应 性 由 目标 旺 数 值 
RE RA REUME E, 故 使 目标 函数 值 越 小 的 染色 体 适 应 性 越 大 , 因此 需 进行 函数 值 /与 
适应 性 fitness 之 间 的 转换 。 我 们 取 目 标 函 数 的 倒数 7 一 17fittness。 

《4) 选择 性 地 染色 体 交叉 ”新 一 代 
的 20 条 染色 体 通 过 对 母 代 染 色 体 进行 ! | 


“ee ШЕ, tatata (Те [s keer: [= [s] же? 
次 随机 选择 两 条 母 代 染色 体 , 在 它们 中 间 | | 

随机 地 寻找 一 个 切割 点 ,交换 其 对 应 参数 切断 处 эй» 

ЗИН. EF RIE Ж. ҖИЛЕ ШЕ 4-18. 8 e 

DEDE QUE ETT 

被 选中 的 概率 与 其 适应 性 成 正比 ,这样 好 Lele ЗЕ 


的 基因 就 能 有 更 大 的 机 会 通过 交叉 保留 
至 下 一 代 ， 本 文 决定 概率 的 方法 为 

рО) =firtness G) /sum (fittness) 
式 中 ，p() 为 第 i 条 染色 体 被 选中 的 概率 ; fittness (站 为 其 适应 性 ; sum Clittness) HERRE 
体 适应 性 之 和 。 有 时 个 别 染色 体会 因 适 应 性 太 大 而 过 度 繁殖 ， 导 致 随后 的 搜索 总 在 此 染色 体 


图 4-18 ЖЕУ 
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决定 的 参数 附近 进行 。 为 保持 参数 点 在 搜索 空间 的 分 散 性 ， 可 定 -个 参数 p, H р>. 
4 20 =8, 

(5) ЖЯ ” 先 按 一 定 的 概率 记 ， 确 定 总 共 需 要 变异 的 基因 数 ， 然 乒 随 机 地 确定 对 哪些 基 

因 进 行 变异 .变异 方式 有 两 种 ， 一 种 是 
gene(new)=gene(old) +r 
即 在 原 有 基因 上 加 减 一 个 [0,1) 之 闻 的 随机 数 。 另 一 种 是 
gene(new)=gene(old) (1c 7/100) 
即 在 原 有 的 点 附近 以 较 小 步 长 进行 搜索 。 

整个 算法 在 第 〈2》 步 与 第 〈5) 步 之 间 循 环 ， 直 至 目标 函数 收敛 。 

在 遗传 算法 中 ， 变 异 方式 影响 目标 函数 下 降 的 速度 ， 单 用 一 种 变异 方式 目标 函数 下 降 很 
慢 ， 用 两 种 方式 可 以 明显 地 加 速 。 两 种 方式 选用 的 次 数 也 很 重要 。 可 采取 一 种 有 针对 性 的 方 
法 : 先 用 大 的 步 长 进行 变异 ， 当 这 种 变异 不 再 起 作用 时 〈 即 通过 ORR. НИШ ЕТ 
降 )， 暂 时 保留 这 20 条 素 色 体 ， 在 后 来 的 繁殖 中 选用 第 二 种 缩小 了 步 长 的 变 引 方法， 而 当 第 
二 种 方式 不 起 作用 时 ( 即 经 过 全 (CREE, BERRADE FRO. 最 后 将 分 别 将 两 种 变异 产生 的 
40 条 染色 体 进行 比较 ,从 中 选 出 好 的 20 条 ,以 后 再 用 第 -种 变异 如 此 重复 。 在 这 里 ， 第 一 
种 变异 方式 可 以 加 快 搜索 速度 ， 而 第 二 种 可 以 在 参数 附近 进行 更 仔 绍 的 搜索 。@ 和 WW 均 取 
3 时， 目标 函数 下 降 较 快 。 

遗传 算 法 参数 的 选择 需 根据 局 题 而 定 ， 从 原理 上 说 , 只 要 变异 和 交叉 的 概率 大 于 0, 经 过 
足够 多 的 签 钙 代 数 , 算法 最 终 总 能 收敛 到 全 局 最 优 , 但 参数 的 具体 取信 会 影响 收敛 的 速度 .在 
- 般 的 遗传 算法 问题 中 (如 求 最 佳 波长 点 ， 确 定 分 于 结构 等 ), 交叉 的 概率 较 大 , 一 般 90% 左 
右 ， 变 异 的 概率 较 小 , 仅 (1~2)%。 但 在 数值 遗传 算法 中 .由 于 染色 体 交 叉 只 能 导致 不 同 数 
值 的 重新 组 合 ， 不 能 产生 新 基因 ， 而 我 们 需要 对 优化 空间 进行 广泛 的 搜索 ， 故 需 对 基因 进行 
强烈 变异 ,经 过 比较 发 现 ， 变异 的 概率 p. 小 于 0. 5 时 , 算法 收敛 较 慢 。 最 终 确定 变异 的 概率 
p. 取 第 一 种 0.5， 第 二 种 0. 8， 交 叉 的 概率 p. 0.5. 

在 遗传 算法 求 极 小 化 问题 中 ， 将 目标 函数 转化 成 适应 性 这 一 步 尚未 受到 重视 。 实 际 十 选 
择 适 当 的 方法 能 够 提高 寻 优 速度 ， 克 服 优化 平台 。 我 们 模拟 了 一 个 函数 ` 

z=4/e%9 + 4/e +2sin2x+ 2sin2y+cos(2/0.7)/C +x)" 
—+cos(y/0.7)/ +y) 5 (4-109) 
0<z<30, 0<y<30 
对 式 4-109) 采用 两 种 不 同 的 转化 方法 分 别 求 极 小 值 。 一 种 为 
fittnessG)— (тах (f) - fG) I min(f))/(max(f)— min(f)) — i—1,2,7.20 
(4-110) 
max СОКО ЖОР ЖЩ Шу K EUER {И min (f) НАИВ. f G) н 
i 条 染色 体 求 得 的 目标 函数 值 。 
另 一 种 转化 方法 为 

fittness (=1/f 0) i=1,2, =, 20 (4-111) 


终止 准则 为 
[min (f*'1)~min(/*) | «0. 00001 
min C/*0 5 A 34 FOR В f POR 1 BO oS BR ВИН, min CP A E ER oR EBD EUH 


PAR. 

用 每 种 方法 运算 15 次 , 运算 结果 均 与 单纯 型 法 结果 - 致 , 但 对 其 染色 体 总 繁殖 代数 进行 
假设 检验 ,发现 二 者 有 显著 性 益 别 。 说 明 计算 达到 同样 精度 , 前 者 所 需 循环 次 数 大 于 后 者 ， 亦 
BS S t HER. 其 原因 是 由 于 该 目标 函数 接近 最 优点 时 有 优化 平台 , 寻 优 达 到 此 区 域 时 、 
用 式 (4-110) 的 线性 亢 数 ,不 同 染色 体 之 间 适 应 性 差别 将 很 小 , 因此 差 的 染色 体 不 能 被 淘 交 ， 
ER 《4-111) 中 目标 函数 与 适应 性 之 间 为 非 线性 关系 ， 当 日 标 隙 数值 越 接近 极 小 值 时 ， 适 应 
性 之 间 的 细微 差别 越 大 ， 因 此 不 同 染 色 体 之 间 的 差别 被 放大 ， 寻 优 将 更 集中 地 在 好 的 染色 体 
决定 的 参数 点 附近 进行 ， 优 化 速度 加 快 。 

(Z) 基于 数论 方法 的 序 贯 优化 法 

穷尽 搜索 是 另 一 种 类 型 的 全 局 优化 方法 ， 该 法 遍历 搜索 空间 中 每 一 可 能 解 ， 并 将 最 好 点 
作为 全 局 最 优 解 。 理 论 上， 穷尽 搜索 总 能 找到 全 局 最 优 解 、 但 是 ， 它 的 严重 缺陷 是 其 优化 效 
率 十 分 低 。 然 而， 如 果 仅 采用 搜索 空间 中 少量 代表 性 解 ， 而 不 是 每 一 可 能 解 ， 优 化 效率 可 纪 
改善 ， 数 论 方法 〈NTM? ， 或 称 为 伪 蒙 特 卡 洛 法 (Quasi MonteCarloMethods). 是 将 数论 和 
数值 分 析 相 结合 的 一 种 方法 。 数 论 方法 最 广泛 的 应 用 领域 足 数 值 积分 、 插 值 、 积 分 等 式 、 微 
分 等 式 等 的 数值 求解 等 问题 。 关 于 数论 方法 详细 的 综述 可 以 参见 Korobov"), Niederreit- 
ero SAVER BE, EF HE. BOOT RTE S MIME TR A, Бр 
和 何 找到 数论 网 点 。 方 开 泰 等 人 就 是 用 数论 方法 (NTM) ES SH 提出 了 基于 数论 全 局 优 
化 算法 ， 并 在 此 基础 上 ， 方 开 泰 等 “和 Niederreiter 等 "提出 了 在 序 贯 收缩 的 搜索 空间 内 均 
名 布点 的 基于 数论 方法 的 序 吐 优化 法 (Sequential Number-Theoretic Optimization. 
SNTOOU, 与 其 他 全 局 优化 算法 相 比 , SNTO 具有 原理 清晰 明了 ， 算 法 易于 实现 等 特点 ， 在 
具体 讨论 SNTO 以 前 ， 先 介绍 一 下 有 关 数 论 产生 均匀 布点 的 基本 概念 。 

1. 数论 网 点 (NT-net) 

数论 中 将 在 一 封闭 有 界 的 域 D 中 均 色 分 布 的 点 集 称 为 上 的 数论 网 点 (NT-net)。 事实 
上 ,数论 网 点 可 被 定义 为 在 DD 上 服从 均匀 分 布 的 代表 点 集 。 方 开 泰和 王 元 的 书 中 介绍 了 儿 种 
存单 位 立方 体 C, 上 产生 NT-net 的 方法 。 其 中 ， 通 过 好 格子 点 (good lattice point set, glp 
BO 产生 的 NT-net 易于 计算 。 好 格子 点 是 通过 glp 产生 表 中 的 产生 向 量 来 构造 的 ， AE 
OF: 

(D Аар НАЕ Т палу h): 为 点 集中 的 样本 点 数 ，* 为 所 考察 空间 

的 维 数 。 
© 产生 glp (x, k=livron}s 

ax m LER 0. 5) йа}, Ehk — 0. S) Ine COSE 0:80 n) Rm dern Kl + } 代 表 了 取 

全 中 的 小 数 部 分 。 方 开 泰 和 王 元 的 论著 可 中 给 出 了 一 系列 glp 产生 表 。 以 下 仅 列 出 二 维和 三 

维 空间 的 glp 产生 表 ( 表 4-45 与 表 ea) 供 读者 参考 。 


表 4-45 二 维 glp 产生 表 


Ay 1 1 1 1 1 1 1 1 1 1 1 
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表 4-46 =H пр 


я 35 101 135 185 266 418 597 828 1016 1220 1459 
h mm 1 1 1 1 1 1 1 1 1 
b m 40 29 26 27 90 63 285 140 319 256 
ha 16 85 42 64 69 130 160 388 237 80 373 


BHRD ERO NT-net 可 通过 单位 立方 体 C, 上 的 NT-net Ж. AN, 5 D 为: 维 
实数 空间 中 的 长 方 体 域 la, b] В, iy kali oo BEREH С, 上 的 NT-net ， 对 于 
给 定 的 a= Cara) b= (b, BIB yim Queccsmo 构造 

Za= hay ^ less (4112) 
Jj x, = (zase ra), b=1, n EE ab] ЕШ NT-net。 
2， 基 于 NT-net 的 序 贯 优化 算法 (SNTO) 


假设 要 搜寻 满足 下 式 的 x" 
MfG )cminfGo (4-113) 
式 中 , D Jb s 维 实数 空间 中 的 封闭 有 界 域 , f (x) ЖЕ XE D EB EE SEK. BF NT-net 的 优 
化 思路 如 下 ， 
RED E BJ NT-net, Us = (хь, k=l, 0, л: WER PR л, 
Mf, )= min f(x.) (4-114) 


式 中 , x; Ee. 中 使 fx) 达到 最 小 值 的 点 , 由 于 f(x) 是 连续 函数 且 D 封闭 有 界 , 容易 证 明 当 
n—ooltt, M,--M. ЖТ, ЗСТ М, 到 M 的 收 伍 效率 不 高 。 为 了 改善 该 法 的 效率 ， 
方 开 泰 和 王 元 提出 了 基于 NT-net 的 序 贯 优化 算法 SNTOUT, 

下 面 给 出 的 是 当 姜 为 * 维 实数 空间 中 的 长 方 体 域 Le ,6 时 的 SNTO 算法 。 
а= lana) bm Grm bL x Cn eon ,SNTO 的 过 程 如 下 ， 

D ЖИМИ. Ft=0, D? —D, a” =a VAR b" b, 

@ 产生 NT-net。 用 gip 集 产生 在 D? —[a' 57] [395] Aii @ n 点 的 点 集 0°. 

SHRUB. WEMA TX x^ Ep? U le? Мо, 

M? = fi?) fv yep? Ux) (4115) 

CB, x CO RSI, OR MORB AR AIL x To M 的 最 佳 近似 。 

Ф 终止 准则 。 SeP= a) /2, WH maxe? 2, 8 为 一 预 于 的 较 小 数 ， 则 可 认为 
DD 收缩 到 足够 小 ， 终 止 算法 并 接受 x ”和 MO, 否则 ， 执 行 下 一 步 。 

© WA RR. MER HR D = [a.p]: 


aj!" —max(x? — Ye? a) (4-116) 


H 
BSP = mint Ye? В) (4-117) 
RF, Y 是 -- 预 置 的 收缩 因子 ， 令 :一 上 十 1， 转 到 加 。 
方 开 素 等 建议 选取 于 盖 mm 一 二 一 … 并 使 用 7 一 0.5。 此 外 、 虽 然 以 上 算法 是 为 长 方 体 搜索 
域 中 的 优化 阿 题 而 设计 的 , 但 可 很 容易 地 将 它 推 广 至 一 般 的 搜索 域 中 。 图 4-19 大 意 地 未 出 了 
SNTO 法 的 优化 过 程 。 图 4-19 中 DD” 的 每 一 边 长 是 DD "的 每 一 边 长 的 1/2。 Rit, MR x”? 
是 刀 上 的 边界 点 ， 则 要 求 DORE DA. Bik. 边 长 有 可 能 收缩 到 小 于 1/207 PUK. {Н 
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НТ SNTO 也 如 模拟 退火 和 遗传 算法 一 样 ， 
具有 跳出 局 部 最 优 的 能 力 , 因此 它 也 能 搜索 到 全 
局 最 优 . 有 关 SNTO 法 全 局 最 优 能 力 的 论述 可 参 
Ж Niederreiter 等 中 种 方 开 泰 等 人 '* 的 工作 。 

搜索 空间 中 的 第 一 次 布点 数 对 SNTO 法 的 
全 局 优化 效果 来 说 至 关 重要 。 推 荐 采用 n>m= 
="…， 是 十 分 合理 的 ， 这 是 由 于 起 始 搜 索 空间 
BA, 因此 ,起 始 搜 索 空间 中 的 布点 数 应 较 多 。， 
决定 了 一 最 好 点 ,第 一 大 搜索 区 域 正 落 在 该 点 附 
ж. RD. 需 售 细 选 择 第 一 次 的 布点 数 4。 通 党 
来 说 ，m 越 大 ， 算 法 收敛 到 全 局 最 优 解 的 可 能 性 
就 越 大 , 但 对 于 一 个 给 定 的 优化 问题 , m ЖИЙЕН ЖИН, ME m 的 大 小 应 由 特定 问题 
标 函 数 响应 曲面 的 复杂 程度 来 决定 。 例 如 ， 响 应 曲面 越 陆 ， 所 需 ' 就 越 大 ,因此 ，m 的 选择 
应 该 能 以 最 少 的 布点 探测 尽 可 能 多 的 全 局 最 优 可 能 域 (可 近似 认为 是 单 蜂 区 间 ), 我 们 推荐 用 
逐步 增加 的 ni 来 进行 试验 。 如 果 增 加 布点 数 所 得 到 的 最 好 点 和 以 前 得 到 的 最 好 点 落 在 同一 单 
峰 区 间 ， 则 可 近似 认为 进一步 增加 布点 数 对 优化 结果 改善 不 大 。 优 化 中 的 一 个 经 验 规则 是 当 
两 点 处 于 同一 单 峰 区 间 时 ， 它 们 具有 相近 的 函数 值 旦 距离 较 近 。 因 此 、 这 两 个 指标 可 用 以 衡 
量 第 一 次 布点 中 找到 的 最 好 点 的 优 度 。 为 此 ， 提 出 了 如 下 的 选择 n 的 方法 ， 

A nOD mn OS ns Jer Bf mS OHRA glp 集 产 生 表 中 。 

Ф i=l. 

O 产生 在 原始 搜索 域 D 上 均匀 分 布 的 含 a.0) 点 的 点 集 о? WR PAN x” Ep A 
M?, 


图 4-19 SNTO 序 贯 搜索 示意 图 


M? = f(x EF V y€ г?” (4-118) 
@ 如 果 ; 一 1， 令 ;一 ;十 1 HAO: BM. HAV. = MOm MOOS = | x°” — 


xcd. 
OMEV, GR S,_, 都 隆 至 较 小 ， 则 可 选取 n GR m C т: BMS i=: LB 
到 @。 
笔者 用 两 个 含有 多 个 局 部 最 优点 和 一 个 全 局 最 优点 的 复杂 数学 雍 数 , 即 
1a? 4-23 — 0. 3cos(3zz)— 0. 4cos(4xy)+0.7 =1<азу<1 (4-119a) 
和 
1+sin?(x)+sin?(y) —0. 1ехр(—22— у?) --10< е, у<10 (4-119b) 
对 SNTO 算法 进行 了 研究 。 由 式 (4-119) 表 出 的 函数 具有 位 于 原点 的 全 局 最 优 和 一 些 局 部 最 
优 ， 有 关 此 函数 的 三 维 图 和 等 高 线 图 示 于 图 4-20。 对 于 该 函数 ， 用 变 步 长 通用 模拟 退火 法 从 
两 个 不 同 的 起 始点 出 发 各 运行 了 4 次 ( 表 4-47), 与 Kalivas 等 人 所 得 结果 一 致 " ,VSGSA 能 
KAAKA СЗАТ 的 全 局 最 优 解 。 在 用 SNTO 优化 时 , 每 次 优化 过 程 中 N 次 布点 中 的 布点 数 
miG 一 1,…,N) 均 相同 ,对 不 同 的 m 测试 了 SNTO 的 优化 效果 CR 4-47), ME 4-47 可 见 , Ж 
了 对 应 于 部 一 21G=1,2,-,N) 的 优化 过 程 以 外 , 其 余 各 次 优化 均 能 收敛 到 全 局 最 优 解 。 正如 
前 面部 分 所 指出 的 ,m 的 选择 影响 SNTO 的 优化 效果 , 因此 选取 x, 以 保证 算法 的 收 化 结果 具 
有 和 较 好 的 可 信和 度 十 分 关键 。 表 4-48 列 出 了 通过 测试 试验 选择 的 结果 。Vs( 一 |M2 一 M OD 
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FS. [xP ито | ) 均 降 至 较 小 , 从 而 瞳 示 第 一次 布点 数 为 4 一 55 Ë n =89 J. 得 到 的 
最 好 点 很 可 能 落 在 间 一 单 峰 区 间 。 因 此 可 以 选取 二 55 Ro 89, RA п,=8 的 优化 过 程 也 
能 以 很 少 的 布点 数 收 伍 到 全 局 最 优 解 ,但 这 是 由 于 所 布 的 点 恰好 落 在 全 局 最 优 解 附近 所 致 ,所 
得 的 结果 并 不 可 靠 。 


图 1-20 HR (1-119a) 表示 的 函数 的 二 维 图 (a) 和 等 高 线 图 (b) 


表 4-47 用 VSGSA and SNTO 对 由 式 (1-119a) 表示 的 西数 所 得 优化 结果 
(全 局 最 优 华 标点 为 (0.0)， 最 优 相应 为 0 


SA BRE 
at 8 起 始 搜 索 点 运行 次 数 所 得 最 优 坐 标点 | 最 优 响 应 目标 西数 运算 次 数 
9.80 | (085.08) 1 (5. 0X1075. - 2.0X107 50X10 835 
2 а. 4Х107,- 24510 5 47x10 8 1450 
| з (“84x10 $,—14X10 7), 4.810 # 815 
4 2.9% 10) 4.11078 1533 
1 (-0.50,- 0.50) 1 222x105 | 710% 818 
z (554X10 Sax) D | 48x10 + 959 
3 | ‹5.1х10 *,2,2х}0 ^ R.4X 1078 1081 
_ i -1X1975,5. 1X L07 $oxie | 28 0 
SNTO 结果 有 
nG=1, N) BBR 所 得 最 优 坐 标点 | 最 优 响应 | 目标 函数 运算 次 数 
8 15 (7.6X10 5,7. 6X10 fv 2.81079 и 120 
21 14 (0. 0714.0) 9.0706 294 
E 15 (,—2.7x107) | ° 825 
89 15 (6. 7X 107 9x107) | 0 1335 


D МРК 0. 15, FR 2 De ESTO > pott hn ӘЙ # ій s 
@ @ЖКЕК ENF 10x 107385, МТО 疼 止 运算 。 


AA RAF 1.0X 107! 时 ,VSGSA 终止 运算 。 


表 4-48 对 由 式 (4 1194) 表示 的 函数 进行 选择 n 的 试验 结果 (一 
i mQ) "iow od Vo S2 
1 8 B 0. 6321 Е Е 
2 21 0. 4395 1 0.1928 6.7075 
3 55 0.2394 б. 20901 0. 5040 
4 89 0. 2464 | 9.007 0. 8799 


DV IM Med], Sy || xt 


ач |; KOR MOSS ER AAR AA Do RU E A БЕЙ АЙ Т АЁ e А - 


由 式 (4-119b) 表示 出 的 函数 具有 许多 局 部 最 优 和 一 位 于 原点 的 全 局 最 优 . ЖООИ ЛУ 
表面 远 比 前 一 个 函数 的 响应 表面 复杂 , 此 隆 数 的 三 维 图 和 等 岛 线 图 示 于 图 4-21。 对 于 该 哨 数 ， 
VSGSA 从 4 个 不 同 的 起 始点 出 发 各 运行 了 2 次 , 表明 VSGSA 的 结果 不 够 满意 ,在 所 有 的 8 
次 优化 过 程 中 ， 只 有 两 次 找到 了 全 局 最 优 解 。Kalivas 等 人 的 研究 显示 ， 对 该 晒 数 进行 优化 时 
通用 模拟 退火 法 (GSA) WE FRA RRR. Ж 4-49 列 出 了 SNTO 对 该 函数 优化 时 ,试验 
AEn 的 情况 ,由 于 该 函数 全 局 最 优 响应 值 和 局 部 最 优 响应 值 的 差别 不 十 分 明显 ,因而 VV 间 
的 差别 不 显著 , 主要 是 利用 5; KER m. X449 表明 在 第 一 次 布点 中 避 二 610 个 点 中 的 最 好 
点 和 二 987 个 点 中 的 最 好 点 间 的 距离 S.—0. 3010, 该 数值 要 比 S, 一 4. 4033 小 得 多 ,内 此 ,nn 
可 选 为 610 或 987。 同时， 表 4-50 中 SNTO 的 优化 结果 表明 ， 不 适当 的 л, 会 导致 SNTO 收 
化 到 局 部 最 优 ， 例 如 ， 当 二 89 Rm = 233 84, AR. WA m= 610 的 优化 过 程 均 收敛 


== 


图 4-21 


449 对 由 式 (14-1194) 表示 的 函数 进行 选择 п, 的 试验 结果 CO 


(b) 


由 式 〈4-119b) 表示 的 函数 的 三 维 图 Ca) 和 等 高 线 图 (b) 


i mü) 最 好 点 的 响应 | Via Sa 
1 85 1.0001 | 

2 144 0.9108 0.0895 6.2236 
3 233 1.0108 0.1002 8.7028 
4 am 1. 0003 0.0105 4. 3749 
5 610 0.9006 0.0997 4. 4033 
5 987 о. 9980 0.0974 0. 3010 


D 所 用 符号 意义 同 表 4-48, 
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Ж 4-50 用 VSGSA and SNTO 对 由 式 (4-119b) 表示 的 函数 所 得 优化 结果 1 
《全 局 最 优 坐 标点 为 O0, 0), 最 优 相应 为 0.9) 


VSGSA ti RU 
bee) seura [imke] geek | 所 得 是 优点 坐标 man | БЕ 
9a (75.62, 9. 06) 1 C*2XI0 | — (—6.283,5. 288) 1.000 3416 
z 47X10 (3186. 3.140) 1.002 5799 
-0.4 (32,5. 78) 1 9.2х10-: хте ат 1079) 0.900 657 
2 9.2 10-5 CA. 2831,0) 1.000 8523 
0,35 | (05-320 1 $2xlo | (—6.1Х10 .—x1x1079 | 0.900 2048 
Por E (8.25.8. 14D ; 1000 2977 
9.38 | (- 6.314160) 1t (GG. 144,8 285) 1.000 | 8297 
2 Log , ёте 
m nG =2, N) 所 得 最 优 相 应 所 得 最 优点 举 标 卓 标 函数 运算 次 数 
89 89 1. 000 | С—6. 2832,0) m 1889 
мі 144 0. 900 (8. 6X 1075.6. 6X10 5) 3024 
238 233 1.000 C- 6 2832. - 8.2832) 4893 
377 377 0. 500 (79.3109. 9.3% 10-8) 7917 
610 m 0. 900 (1.81077, qoex1005 3490 
610 89 0. 900 (—8. 6> 10 3. 3X 1077) 2390 
610 E ] 9. 900 (3.5 X10 5.3. 3X 1079) 716 


D BARE 4-47, 

@ 及 有 选 代 次 数 均 为 91， 其 余 运 行 条 件 同 表 4-47。 
到 全 局 最 优 解 .在 一 个 极端 的 情况 下 ,二 610 和 如 二 8(i 二 2,…,21) 的 优化 过 程 也 找到 了 全 局 
RRM. TE, TA SNTO 对 复杂 函数 优化 的 过 程 中 ， 选 取 пала AME. R 
大 的 未 有 助 于 使 起 始 邻 域 落 在 全 局 最 优 附近 ， 而 相对 较 小 的 (>1) 则 有 助 于 减少 总 计算 
HR. 需要 指出 的 是 ,和 前 面 的 例子 类 似 , 虽然 一 144G 二 1.2,…,21) 前 优化 过 程 也 找到 了 全 
局 最 优 ， 但 其 结果 并 不 可 信 。 

将 此 法 用 于 灰色 分 析 体 系 定量 分 析 (参见 第 六 章 ), 在 存在 未 知 干扰 下 直接 测定 待 测 组 分 

的 浓度 , 得 到 了 较 好 的 结果 , 结果 表明 SNTO 和 VSGSA 对 混合 物 的 定量 结果 无 显著 差异 .但 
VSGSA 评估 目标 函数 值 的 次 数 明显 多 于 SNTO C, 
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第 五 章 分析 检测 理论 与 信号 处 理 方法 


分 析 检 测 理 论 与 信号 处 理 方法 主要 包括 两 个 方面 的 内 容 ; L 有 关 分 析 信 和 号 的 基 测 误差 、 
检测 下 限 和 统计 检验 ,这 一 部 分 主要 来 自 数理 统计 的 理论 和 方法 ,属于 经 典 的 统计 学 范畴 ……; 
@ 分 析 仪器 信号 的 预 处 理 , 这 一 部 分 涉及 现代 信号 处 理 的 理论 和 方法 和 近年 来 发 展 的 小 波 分 
析 新 方法 ， 均 属于 本 章 讨论 的 内 容 nS 

本 章 将 先 对 分 析 方 法 的 检测 限 、 分 析 数 据 的 统计 检验 和 统计 推断 和 方差 分 析 作 出 较 详 细 
的 介绍 。 人 包括 涉及 到 的 经 典 的 统计 党 及 相关 计算 机 程序 。 在 分 析 信号 的 预 处 理 方法 的 介绍 方 
面 ， 对 于 -- 般 常用 的 经 典 方法 ， 如 分 析 信号 的 平滑 方法 、 分 析 信号 的 求 导 方 法 、 分 析 信和 号 的 
变换 方法 都 将 给 出 必要 的 介绍 ， 但 主要 着 重点 将 放 在 介绍 日 前 已 经 或 开始 受到 化 学 计量 学 研 
究 重视 的 多 变量 处 理 的 新 方法 之 上 ， 即 基于 卡尔 吝 滤 波 和 小 波 变 换 欧 信号 预 处 理 方法 、 在 详 
细 介 绍 这 些 方法 的 基本 原理 的 基础 上 ， 对 它们 的 基本 思路 和 基本 算法 亦 将 给 出 详细 介绍 ， 并 
给 出 相应 的 计算 机 程序 和 计算 时 所 需 的 数据 表格 。 

第 一 闻 AGREGAR 

定性 分 析 的 任务 是 检测 某 种 成 分 在 试 样 中 是 否 存 在 。 定 性 分 析 中 能 检测 的 最 低 含量 ， 以 
“检测 限 ” 表征， 有 关 分 析 方 法 检测 限 的 定义 ， 曾 是 分 析 化 学 中 长 期 争议 的 问题 ,国际 纯粹 与 
应 用 化 学 联合 会 (International Union of Pure and Applied Chemistry, TUPAC) 建议 的 检测 限 
ЖД. ARE a 或 物理 量 gi 表述 的 检测 限 , 是 由 用 给 定 的 分 析 方 法 能 以 一 定 的 准确 度 
检 出 的 最 小 测度 n 导出 的 。 这 一 概念 后 被 简化 为 “检测 限 是 给 定 分 析 方 法 能 可 靠 地 检 出 的 最 
低 浓 度 ”( 美 国 化 学 会 )94。 如 何 度量 上 述 定义 中 的 “一 定 的 确定 度 ” 及 “可 车 地 检 出 ”这 些 报 
念 ? 这 只 能 建立 在 统计 理论 基础 之 上 ， 因 此 ， 分 析 检 验 理论 是 定性 检定 的 统计 理论 基础 。 

在 统计 检测 理论 基础 上 , 可 给 出 分 析 方 法 检测 限 的 严谨 定义 。 设 有 分 析 信 号 у, HAARE 
7 与 噪声 或 误差 5 组 成 


y=n+Š 
8 服从 均值 为 零 , 标准 差 为 o EDS, 即 6~N(0,0). 要 检测 这 一 分 析 信号 , 需 考察 空白 
信号 与 分 析 信 号 两 者 的 概率 密度 函数 , y 的 产生 有 两 个 来 源 : 待 测 组 分 的 存在 〈 其 浓度 000. 
分 析 仪 器 的 噪声 〈 仪 器 噪声 ) 和 /或 分 析 反 应 的 空白 值 (化 学 噪声 )， 即 c 一 0 时 的 空白 信号 y 
以 最 简单 的 线性 模型 为 例 ，y 和 。 的 关系 可 写成 
3 一 加 十 如 
6 为 线性 校正 模型 中 的 斜率 或 灵敏 度 。 
从 统计 上 讲 ， 模 型 涉及 两 个 概率 密度 函数 ， 空 白 信号 的 概率 密度 函数 Po(y) 是 与 < 一 0 对 
应 的 ; P,{y) 则 是 对 应 于 分 析 信 号 的 概率 密度 函数 《c>>0， 见 图 5-1》，? 一 2 为 净 分 析 信号 。 
确定 分 析 检 测 限 等 价 于 选择 下 人 述 两 种 假设 判决 之 一 : 
,一 一 测 得 的 信号 属于 分 布 P,(y)， 即 信号 来 源 于 空白 噪声 ， 判 决 待 测 的 组 分 不 存在 。 
H,— 测 得 的 信号 属于 分 布 P.GO, ， 即 信号 来 源 于 待 测 组 分 ， 判 决 待 测 的 组 分 存在 。 
进行 H, 和 H, КӨЕН, 需 有 一 定 的 统计 检测 准则 ,以 确定 信号 指标 轴 上 某 一 称 为 判决 
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水 半 或 检测 水 平 x 的 值 ， 作 为 将 信号 域 划 分 为 R. MR 的 分 界 〈 见 图 5-1), yS y, 时 
(RO) 选择 Ho урун (R. 域 》 选 择 厅 :， 这 种 选 拌 正确 与 罕 ， 可 用 下 述 概率 描述 ; 


fly) 


2 


图 5-1 空白 与 分 析 信和 叶 的 概率 密度 函数 


COO 根据 分 析 信号 选择 态 ,， 且 待 测 组 分 确实 不 存在 其 概率 Pw 为 
Pa = Ѓ ло = [. PG|HOdy 


Bt Poy |H, SURI H 是 正确 的 条 件 下 信号 的 条 件 概率 分 布 , 亦 记 为 PO), FER OR 
示 信 号 来 源 于 空白 噪声 。 
(2) 待 测 组 分 确实 不 存在 ， 误 选择 H. 《第 一 类 错误 ， 即 以 假 为 真 )， 其 概率 PSU 


Po = [Poy = | Рону o1 Po 


O 待 测 组 分 确实 存在 ， 而 误 选 择 H, (GAAR MURAD, HER PH 
Pu = рода = | РУН dy 


EH 是 正确 的 条 件 下 ， 信 号 的 条 件 概 率 记 为 PO. FR i 表示 存在 待 测 组 分 。 
O 待 测 组 分 确实 存在 ， 选 择 五 ， 其 概率 PLA 


P. = | Pods = | POL dy = Р 
在 信号 检测 理论 中 ,提出 了 许多 检测 准则 ,其 中 较 有 代表 性 的 是 Bayes ЕЩ , Boyes 准则 
要 求知 道 U AL, 的 验 前 概率 9 和 1g, 并 需 给 出 上 述 4 种 决策 下 的 风险 Cos Cros Сы, Cus 
这 样 就 可 以 计算 平均 风险 C 
€ = [Cof root + c, 0087 


t а= ФГС," Paddy + Caf? rox 

使 得 上 式 的 平均 风险 最 小 的 判决 界 即 可 视 为 Bayes 判决 检测 限 。 

在 分 析 检 验 中 较 适宜 采用 的 判决 准则 是 Neyman-Pearson 准则 已。 在 分 析 检 测 中 , 例如 产 
品质 量 检验 ,如 根据 有 菜 种 杂质 存在 于 产品 中 作出 “产品 不 合格 ”的 判决 ， 则 生产 必须 停 直 ， 
这 时 如 系 误 判 , 将 造成 一 定 损失 , 应 限制 Po 在 一 定 范围 之 内 。 Neyman-Pearson 准则 的 基本 思 
WUE, FEET Po 某 一 给 定数 值 以 确定 判决 水 平 yee 

如 设 分 析 信 号 与 空白 噪声 均 服从 正 态 分 布 ， 则 有 


Py = Гро = a, Zza) | expl— O — 3» (20°) My 


在 此 ,y 是 空白 信号 (噪声 ) 的 均值 ,0 为 其 标准 差 , 作 变 换 , 令 x 二 (y 一 yo) /o HIB On уо) Го 为 
2, 


Pa = af VID | expc- Ddy 


则 判决 水 平 (或 称 检测 水 平 )y 为 

y = Yom Bat 
即 当 y< 8 CR, 域 ) 判 决 Ho 否则 判决 Ay. 在 此 对 于 分 析 信 号 y, WEB ee S "E LR 
号 的 标准 差 相 同 ， 即 均 为 a。 如 平行 测定 л 次 ， 得 分 析 信 人 号 的 均值 yxw; 其 标准 差 将 为 o, = 
sf n, 


XuoXyeme!V n ARH) 
ко 2001 n HR HO 
= 值 可 由 给 定 的 Pu 值 借 Laplace 函数 或 从 标准 正 态 分 布 表 中 求 出 .例如 ,Pu 取 0. 01, 即 第 一 类 
错误 概率 为 1% 时 
Py = 0.01 = Q/ са 2/Ddz = 1 — FG) 


Я 


由 标准 正 态 分 布 表 可 查 出 z, — 2. 32, 已 知 空白 信号 均值 yo 及 其 标准 差 о, 即 可 确定 判决 水 平 、 
在 给 定 的 Pue 值 的 条 件 下 作出 待 检测 物质 是 否 存在 的 判决 。 

在 统计 检测 理论 基础 上 ， 可 给 出 分 析 方法 检测 限 的 严 浇 定义。 现 试 将 分 析 信 号 у 与 噪声 
yo 的 概率 分 布 图 与 对 应 的 待 测 物 浓度 相 比 较 加 以 考察 (图 5-2) 首先 按 Neyman-Pearson 准则 
给 定 Po 值 以 找 出 ym y. 判决 线 ， 由 此 算出 z 及 判决 水 平 或 检测 水 平 y Ë. x Ro 由 实验 
求 出 


PS Yt aT, 


R. 


Ro 
ye Pot? me 
(Puh (Pa), 
Р, 3 
d. 4 EENS 
1222257, | 
5, E 
L 1 


0 t (c) 
图 3-2 分 析 方法 检测 限 的 定义 


Ey 确定 后 , 从 不 同 均值 y 对 应 的 分 布 曲线 中 , 选取 其 与 у= э» 判决 直线 相交 给 出 的 已 ,等 于 
(Pa 的 曲线 ， 这 条 曲线 的 均值 y, 所 对 应 的 cx 即 为 所 求 的 浓度 检测 限 。 不 用 图 解法 亦 可 由 检 
测 特性 函数 关系 直接 计算 与 Pu 对 应 的 <， 亦 即 检测 限 cz。 显然 、 这 样 定义 的 检测 限 ， 明 确 地 
给 定 了 正确 检 出 的 概率 ,和 和 错误 检 出 的 概率 Pos 而 Pwo=1 一 Pio， Pu 一 1 一 Pn， 这样, 前面 
所 述 的 4 种 概率 都 是 完全 确定 的 。 分 析 化 学 文献 中 一 般 定义 检测 限时 所 称 “ 可 靠 地 检 出 ”、 
“以 一 定 的 确定 度 检 出 ”等 概念 在 这 里 有 了 明确 的 数量 界限 。 
检测 限 的 另 一 种 表示 方法 是 给 定 Pa 及 Pis 下 对 应 的 r、 或 记 为 rz 
ға (уа yi /o= = — m 

та 实际 就 是 与 检测 限 对 应 的 信 品 比 ， 或 称 可 千 地 检 出 待 测 组 分 所 需 的 最 低 信 噪 比 。 噪 声 是 一 
客观 存在 的 事实 , 在 给 定 的 噪声 下 , 信 噪 比 完全 由 符 测 物 浓度 大 小 决定 。 如 信 噪 比 低 于 xz, 检 
出 将 不 可 能 按 给 定 的 Pi、Pu 值 实现 。 


P(y) 


2 


ө) 
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FUR rs 对 应 的 分 析 信号 w 是 
¿= уо r0 уо Gu— 216 
分 析 化 学 文献 中 一 般 写成 
Y= y + Ke 

有 关 K 值 的 确定 ， 长 期 未 取得 一 致意 见 。 由 上 述 分 析 可 见 , K 的 物理 意义 即 是 与 检测 限 对 应 
的 信 噪 比 。 而 无 论 是 检测 限 或 信 噪 比 的 数值 ， 除 与 分 析 方 法 本 身 的 特性 如 y. CA) 及 
а 《标准 差 ) 有 关外 ， 还 取决 于 我 们 要 求 的 P,、P 及 分 析 系统 的 检测 特性 函数 . 一 般 认为 天 
应 取 3, 可 以 证 明 ,此 时 当 P, 取 足够 小 (0, 001), 即 犯 第 一 类 错误 的 概率 很 小 时 .但 己 , 仅 0.50， 
有 50% 的 概率 犯 第 二 类 错误 。 也 就 是 说 ,KK 的 确定 与 我 们 对 分 析 问题 的 要 求 有 关 ， 如 果 要 求 
犯 第 一 类 错误 〈 以 假 为 真 ) 的 概率 要 小 ， 但 对 犯 第 二 类 错误 〈 以 真 为 假 ) 的 概率 无 严格 要 求 
BY. 天 可 以 取 小 一 些 ; 反之 , 如 果 要 求 犯 第 二 类 错误 的 概率 亦 必 需 小 时 , K 值 则 必须 足够 大 。 


第 二 节 分析 数据 的 统计 检验 方法 


一 、 分 析 结果 的 检验 


在 分 析 测 试 中 ， 测 定 值 将 不 可 导 免 地 竖 受 到 许多 随机 因素 的 影响 ， 这 些 个 别 的 因素 对 测 
定 误差 的 影响 虽然 很 小 ， 但 各 个 因素 的 影响 综合 起 来 仍 会 对 测定 结果 产生 明显 影响 。 从 概率 
论 的 观点 来 看 ， 测 定 误差 是 很 多 数值 微小 而 又 相互 独立 或 弱 相 关 的 随机 变量 之 总 和 ， 是 一 个 
随机 变量 ， 遵 循 或 近似 地 遵循 正 态 分 布 ， 可 用 正 态 分 布 的 概率 密度 活 数 来 描述 大 样本 测定 的 
误差 分 布 ， 即 

T= Tine te— heme te 

р, z 为 分 析 测 定数 据 ; zene 设 为 该 分 析 样 本 在 无 任何 量 测 误 差 存 在 时 的 真实 值 , 它 一 般 由 
某 一 仪器 常数 与 该 样本 的 真实 浓度 的 乘积 kcwwe) 表 出 :。 为 遵循 或 近似 地 遵循 零 均 等 方差 正 
态 分 布 的 量 测 误 差 。 然 而, 通常 的 化 学 分 析 测 定 ,都 有 是 小 样本 试验 ， 只 进行 3~5 次 测定 ,如 
此 小 样本 试验 并 不 能 求 得 正 态 分 布 的 总 体 均值 x 和 总 体 标准 差 。, 只 能 求 得 样本 均值 z 和 样本 
标准 差 s， 因 此， 无 法 直接 应 用 正 态 分 布 于 小 样本 试验 数据 。 直 接 采 用 样本 均值 z< 和 样本 标准 
其 :来 进行 检验 ， 需 要 应 用 类 似 正 态 分 布 的 :分布 参见 第 十 一 章 }。 

1. 上 检验 的 程序 

进行 上 检验 的 程序 可 归纳 如 下 ， 

O 根据 实际 问题 作出 原 假设 H 和 备 择 假设 H. 

《2》 选 定 所 用 的 统计 量 ; 

© 当 检验 样本 均值 z 与 总 体 均值 < 是 否 存在 显著 性 差异 时 ， 使 用 如 下 统计 量 ， 

t (z—p)/G/ у п) 

式 中 ,为 测定 次 数 。 

O 当 检 验 两 个 样本 均值 之 间 是 否 存在 显著 性 差异 时 ,使 用 统计 量 ， 


t= (ar) ÙN #(1/m 1/22 ] 
在 此 
x= [Gu Dsi + 0 — 1988 ]/G +®—2) 
(3) 选 定 显著 性 水 平 *， 决 定 拒绝 域 5。 


(4) 随机 抽取 样本 ,计算 样本 平均 值 < 和 样本 方差 S°. 

(5) 计算 统计 量 值 . 若 由 样本 值 计算 的 统计 量 落 人 拒绝 域内 , 即 由 样本 值 计 算 的 统计 量 
大 于 :分 布 表 中 相应 的 显著 性 水 平 a 和 相应 自由 度 (二 一 1) 下 的 临界 值 t,x, 则 拒绝 接受 不 
假设 百 。: 芒 由 样本 值 计 算 的 统计 量 落 人 非 拭 绝 域内 , 即 由 样本 值 计算 的 统计 量 小 于 上 分布 表 
中 相应 的 显著 性 水 平和 相应 自由 上 度 .f( 二 x 一 1) 下 的 临界 值 1。,y, 则 接受 原 假设 Ho 若 由 样本 
值 计算 的 统计 量 落 人 拒绝 域 与 非 拒 绝 域 的 边界 附近 ， 邮 由 样本 值 计算 的 统计 量 与 1 分布 表 中 
相应 的 显著 性 水 平 a 和 相应 自由 度 f(=n 一 1) 下 的 临界 值 t,y 相 近似 ， 则 原 假 设 ,处 于 被 二 
疑 状 态 ， 这 时 最 好 是 继续 进行 试验 ， 而 后 将 新 旧 样 本 值 合 起 来 计算 统计 量 再 进行 检验 。 

2. 举例 来 说 明 如 何 进行 上 检验 

某 化 工厂 从 以 往 的 生产 数据 知 ,在 生 产 正常 的 情况 下 ,产品 中 平均 含 铝 量 为 0.45%, Ж 
日 随机 抽查 了 五 批 产品 ,测定 会 铅 量 分 别 为 0. 48%、0. 44%, 0.4296, 0.47%, 0.43%, T] 
在 显著 性 水 平 a=0.05 下 产品 中 的 平均 合 铝 量 有 盛 变 化 ? 

RR: (D BRR Ho a0 45; 备 择 假设 HI: p0. 45; 

(2) 选 定 检验 统计 量 


r= (т-р) мп) 

OD 选 定 显著 性 水 平 * 一 0. 05, 注意 到 本 例 为 双边 检验 , 即 含 铅 量 有 无 变化 (大 了 与 小 了 
都 不 同 于 原先 的 含 铅 量 )， 查 上 分 布 表 得 ,te 一 2. 78. — ооа 2.78, ДНЕ 0 |е |222. 78 
的 区 域 5。 

(4) 计算 样本 平均 值 和 样本 方差 5*。 
z= (1/n) Dix, = 0.448 
S = [1/G — IIE, — x» = 0. 00067 


《5》 计 算 统计 量 什 
£— (0. 448—0. 45)/(s/ vV 5 )=—0. 02/0. 0116 一 一 1.727 
(6) BHM, DR [r1 — 1. 7272. 78. 故 可 接受 原 假设 , VOW ea SOP АШЫШ 
无 显著 性 变化 。 


=. 分 析 结 果 的 方差 检验 


对 一 个 试 样 进行 多 次 重复 测定 时 , 由 于 测定 受到 各 种 因素 的 影响 , 各 次 测定 值 并 不 相同 ， 
它们 之 间 的 差异 称 为 变 差 。 变 差 的 大 小 通常 用 样本 方差 或 样本 标准 差 来 量度 。 方 差 的 大 小 反 
映 了 测定 结果 的 精密 度 ， 是 衡量 试验 条 件 稳定 性 的 重要 标志 。 为 评价 分 析 方法 与 测定 结果 的 
优 劣 ， 比 较 各 种 分 析 方法 与 测定 结果 的 测定 精密 度 ， 一 般 就 需 采用 方差 检验 的 方法 。 

(一 ) 一 个 总 体 的 方差 检验 

车 六 是 遵从 正 态 分 布 N(x,0) 的 随机 变量 ,其 中 e lo AM zú ze v z, AE 
中 随机 抽取 的 样本 值 ， 其 样本 方差 为 St(= X Gs — 2) / — 109, Ди DS BA X 4 
布 ( 见 第 十 章 ), 即 


Хп = DSt/sà = Dr x0/oY ~ Yin — D 
EPa- DA x THA H E , 
对 于 给 定 的 显著 性 水 平 ,在 x* Dod dep 8] d d НН HE f = QO— DETERIUS XE, Bü 
Xü ong. 使 得 
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OC Xa) a2 
P IYO onsh=l—ar2 
BE Pikun ау) 1а 

归结 起 来 ， 方 差 检 验 的 一 般 程序 可 如 下 : 

(1) 建立 原 假设 Н»: 时 一直， 这 里 о, 为 一 要 求 的 方差 。 

(2) 计算 统计 量 : Y= (n 一 1) 5/0. 

O 给 定 显著 性 水 平 a， 查 表 得 到 相应 的 YL... M XL ЕЖЕ PREM: 

XI a ESN, 

ЕЗҮ, UGK ER Se, UE TNE, BRR 

下 面 仍 用 一 个 实例 来 加 以 具体 说 明 。 

某 钢 厂 测定 铁水 中 的 含 碳 量 ， 在 稳定 生产 情况 下 ， 可 假定 服从 正 态 分 布 ， 其 方差 按 往常 
YOM TY EW о. 0487, 某 日 测定 5 炉 铁水 , 测 得 的 含 碳 量 分 别 为 4. 32, 4.55, 4.36, 4.40, 4.44, 
试问 其 方差 与 0. 048° 是 否 存 在 显著 性 (显著 性 水 平 a=0.10) BH. 

(D 建立 原 假设 Ho: 5" —o06—0. 048". 

O 计算 样本 统计 量 : 

Xk+] = (2 — 128/0 = Da, — 2/6 

=1/0. 048 [ (4. 32—4. 414)! + (4. 55—4. 414)? + (4. 36—4. 414)? + 4. 40—4. 14)? 
十 4. 44 一 4. 414] 
— 1/0. O48 [ (0. 094)? + CO. 136)* (0. 054)? (0. 0140" + C0. 02607] 
一 13.6 
@ 给 定 显著 性 水 平 二 0.10， 由 Xp 一 9. 49:20 5,470. 711, 使 得 
P{0. T11 Xe SI. 49} =0. 90 

由 于 13.6 KER (0.711, 9.49] 2A, AMGEN. АЗЕ НТ, ВОК 
中 的 碳 含量 不 稳定 。 

(=) 两 个 总 体 方差 检验 

Жолу To "O ¿a МАМЕ N (ai ol) B) m PARAS yo уз nns 3 为 总 体 N Ga o Bon, 个 
样本 ， 且 它们 相互 独立 ， 由 于 : 

Gy 1051/0 X On 
(по 1)S;/o1— X Gui) 


我 们 有 
GUaD SUD Ее 
BD, 51/51 BJ B CN 0—1), ALAREN OS D 的 正 分 布 (参见 第 十 一 章 )， 若 
假设 Ho: oie. M 
SUSS Fe, imo 
Вр S/S 服从 第 一 自由 度 为 mD 第 二 自由 度 为 《ns 一 1) 的 正 分布 ， 且 不 带 未 知 参 数 。 因 
此 


Fas 51/58 
就 可 作为 原 假设 Н, 的 检验 统计 量 。 由 上 式 作为 检验 统计 量 进行 显著 性 检验 的 方法 ， 就 称 为 
FRE. 
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下 检验 的 原理 , 可 以 这 样 来 理解 。 因 为 样本 方差 Si ЖП S 2} 3] E á E of 和 o; 的 无 入 
Jib ST 和 Si 理应 分 别 在 中 和 芝 附 近 据 动 ,因此 ,如 果 原 假设 只 = 成立, 则 Fa | 51758 K 
大 或 太 小 ， 都 表明 原 假 设 H, TER, HEARRE. 

现 仍 以 一 个 实例 对 下 检验 方法 加 以 具体 介绍 。 

设 用 两 种 不 同方 法 冶炼 某 种 金属 材料 ,分 别 抽样 测定 其 杂质 的 含量 (%), 得 表 5-1 所 水 
的 结果 ， 


表 5-1 两 种 不 同治 炼 方法 所 得 的 杂质 含量 


LIE 新 冶炼 方法 原 治 炼 方法 新 冶炼 方法 
26.9 226 sd 23.4 
22.8 22.5 | 27.2 20.5 
25.1 20.6 | 30.2 
23.0 23.6 21.5 
22.3 24.3 ] deo 
24.2 21.9 25.1 
26.1 1 23.2 


Te] x PaO 24a HR Ar E BEA BU ZUR REID ЭТ 24 Rm FE REGE RR 

将 原 方法 和 新 方法 的 杂质 含量 分 别 计 为 了 和 7, fog CHUA IER Ai N Caso) m RAE 
ЙЛ МС) ,根据 所 提问 题 ,提出 如 下 原 假设 Ho i= o; 

根据 所 得 数据 计算 下 检验 统计 量 : Fa Í 5.75, 


А 
m=13 ®=25.68& S- EDG- X) = 6.178 


m= 9 y= 22.51 Si= +O, — 9° = 1.652 


Feraro = 53/5} = 6. 178/1. 652 = 3. 74 
对 于 给 定 的 显著 性 水 平 二 0.05, 在 五 分 布 表 中 查 第 一 自由 度 为 12, 第 二 和 白 由 度 为 8 Ий 
BAR Fos.6, 一 3. 28, 由 于 3. 7427 8. 28, 央 而 拒绝 原 假 设 巨 ,, 认 为 这 两 各 冶炼 方法 的 杂质 合 量 的 
方差 是 显著 不 同 的 。 
在 此 ， 值 得 提出 的 是 ， 在 编制 下 分 布 表 时 ， 是 将 大 方差 作 分 子 ， 小 方差 作 分 母 ， 所 以 在 
由 样本 值 计 算 统 计量 Fy# 时 ,也 要 将 样本 方差 5, 和 S, 中 数值 较 大 的 一 个 作 分 于 , 较 小 的 一 个 
作 分 母 。 


第 三 节 分 析 信 号 的 平滑 方法 
平滑 方法 是 分 析 信号 预 处 理 中 一 种 常用 的 去 噪声 以 提高 信 品 比 的 方法 ， 在 分 析 化 学 的 信 


号 预 处 理 中 得 到 了 广泛 的 应 用 。 本 节 所 介绍 的 平滑 方法 包括 最 简单 的 窗口 移动 平均 法 、 窗 口 
移动 多 项 式 最 小 二 乘 拟 合 平滑 法 、 窗 口 移动 中 位 数 稳健 平滑 法 粗糙 惩罚 平滑 法 。 


一 、 窗 口 移动 平均 法 


因为 对 一 组 含 噪声 的 量 测 数 据 进行 均值 运算 时 可 显著 地 提高 量 测 数据 的 信 噪 比 ， 故 此 方 
法 可 用 来 对 分 析 信 号 进行 平滑 处 理 ， 是 平滑 处 理 中 一 个 最 简单 方法 。 
对 于 -- 个 含 噪声 的 波谱 或 电化 学 谱 (其 量 测 点 为 个 )， 若 对 其 中 第 ;个 点 及 其 前 后 各 
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m AR SR 413 STF НЕ A — ЖЫ N 一 2m 十 1, 则 窗口 移动 平均 法 的 计算 公 
式 为 


le 
“тв = N У] доене 1060) 


Em 


明显 可 知 平滑 后 的 第 i 个 点 的 数 什 为 这 《2m 十 1) 个 量 测 数据 的 平均 值 ，(2m 十 1) 也 就 是 窗口 
的 宽度 。 然 后 依次 移动 此 窗口 ,以 上 式 求 得 第 (一 1) 个 点 上 的 平湖 后 数据 . НЕ DOE 

量 测 点 数据 计算 完 ,故此 法 有 窗口 移动 平均 法 之 

T5 称 。 图 5-3 对 此 给 出 了 一 个 形象 示意 图。 

МЕ 5-3 中 还 可 以 看 出 ,采用 这 种 窗口 移动 
法 对 波谱 量 测 值 前 加 个 点 ， 以 及 后 m 个 点 不 能 
进行 平滑 运算 , 故 所 得 的 平滑 后 波 庄 会 有 委 拓 这 
些 边界 点 信息 的 损失 。 另 外， 窗口 宽度 m~ 
1) 的 选择 也 是 一 个 值得 讨论 的 重要 因素 ,窗口 太 
Apt ОШ 28-13), 平滑 去 噪 效果 将 不 佳 , 而 
窗口 太 大 时 ， 则 由 于 此 法 是 进行 简单 求 均 值 运 
É, 平滑 后 的 波谱 有 波形 失真 之 瑶 。 这 些 因素 在 
| 选用 此 法 进行 平滑 处 理 时 ， 都 是 值得 考虑 的 
因素 。 


二 、 窗 口 移动 多 项 式 最 小 二 乘 拟 合 平滑 法 


在 此 介绍 的 窗口 移动 多 项 式 最 小 二 乘 平 滑 
法 是 由 Savitzky 1) Golay[9 共 同 提 出 的 ,此 法 不 
图 5-3 窗口 移动 平均 法 的 示意 图 是 采用 简单 平均 运算 ,而 是 在 窗口 移动 运算 中 引 
人 多 项 式 最 小 二 瑟 拟 合 ， 故 该 法 可 做 到 既 能 去 噪 提高 分 析 信号 的 信 噪 比 ， 又 可 较 好 地 保持 分 
PHS 〈 波 谱 》 中 的 有 用 信息 。 此 法 虽 早 在 20 世纪 60 年 代 担 出、 至今 仍 在 分 析 化 学 信号 预 
处 理 中 频繁 使 用 。 
窗口 移动 多 项 式 最 小 二 乘 拟 合法 计算 的 基本 思路 与 前 述 窗口 移动 平均 是 类 似 的 ， 唯 一 不 
同 的 地 方 只 是 此 法 没有 使 用 简单 的 平均 而 是 通过 多 项 式 来 对 移动 窗口 之 内 的 波谱 点 进行 多 项 
式 最 小 二 乘 拟 合 ， 将 窗口 内 — 200-1 个 等 距离 点 Оол 一 般 可 取 1 至 12) 的 数据 ， 拟 合 为 
G—D 阶 多 项 式 
ду=ау+ај+а р аф =—m,—mil ml ml) -D 
通过 对 上 式 进行 最 小 二 乘 拟 合 就 可 得 到 一 个 求 得 蕊 ， 即 窗口 内 中 心 点 的 计算 公式 ， 以 后 我 们 
就 可 以 看 到 ， 所 得 的 公式 与 窗口 移动 平均 法 的 唯一 不 同 点 就 在 于 多 项 式 拟 合法 实质 上 是 一 种 
加 权 平 均 法 ， 它 更 强调 中 心 点 的 中 心 作用 而 已 。 
下 而 以 -- 个 窗口 为 5 的 二 次 多 项 式 为 例 来 加 以 具体 说 明 。 根 据 式 (5-1) 有 


x(t) 


E) 


xCi-acaC-2)0aC-2Y (5-22) 
«бт=а+а(—1)+а(—1)* ‹5-2Ь) 
ah=a,+a,(0)+a,(0)? (5-20) 

az =ata (ted) (5-24) 


ae? =a ta (2) +a, (2) (5-2e) 


亦 即 
z- =a ada гр o aj 
атаа |y —1 11 [а] 
а= -| 00 “| (5-3) 
ai ада a, 1 1 | 
xi =a, tH 2a + 4a, h 24 
x=Ma 
其 中 
[7-4] 
xti 
x= |z, (5-4) 
Pa 
M" 
1 -2 d 
1 —1 1 гал 
M=|1 00 cp G5 
1 11 
1 2 4] 
解 此 方程 可 得 
a= MM) Mr 
将 所 求 4 代 入 式 * 二 MM a=M(M'M)CM' xH, BTS 
R= š Ста 9471-7825 — 9257 Зар) (5-62) 
Boa Rox кїз ов cient (5-6b) 
Rede CC Ancien e Vrat Lea 32 (5-60) 
Si =E seit Be aea Ee (5-64) 
Geta GaP 5а Bah HT Sa) (5-66) 


f bu Ed.xGg-—2.—1,011,2,G-1, 70 RE z 计算 而 得 ,其 上 标 ;为 波 
EHI 5 0 2E CP Oe iO EK IERA te LS ЗЕ BERR EB» 
而 下 标 ; 则 表示 在 窗口 中 相对 于 中 心 点 0 的 位 置 点 , 故 有 正 负 之 别 ,负数 表示 在 中 心 点 0 位置 
的 左边 , 正 数 表示 在 中 心 点 的 右边 。 

如 前 所 述 ,窗口 移动 多 项 式 最 小 二 乘 拟 合法 与 窗口 移动 平均 法 的 差别 仅 在 于 前 者 是 一 种 
强调 中 心 点 作用 的 加 权 平 均 , 故 在 上 述 式 (5-6)5 个 式 子 中 ,窗口 移动 多 项 式 最 小 二 乘 拟 合法 
真正 用 到 的 只 是 中 心 点 , 即 双 的 表达 式 


gel 
° 35 


(= За 3227) E228 122671 — 823) (5-7) 
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ARAM OE Fin. OHI НИП nres Q X ree 丰美 人 式 子 后 得 
m= Ser! (5-8) 


E 


È (5-8) 可 称 为 窗口 移动 多 项 式 最 小 二 梯 拟 合法 的 通 式 . 式 中 4 可 称 为 归 一 化 常数 ，(2m 十 
1) AANER. w, 为 相应 的 权重 数 ， 故 在 窗口 宽度 确定 以 后 ， 就 有 其 相应 的 we, 值得 指出 
的 是 多 项 式 次 数 的 选择 是 可 变 的 ， 前 述 例 子 只 是 给 出 了 二 次 多 项 式 平滑 的 例子 。 实 际 亦 可 用 
3 次 , 4 次 其 至 更 高 次 的 多 项 式 来 拟 合 。 当然 相应 的 归 一 化 常数 和 权重 就 会 发 生变 化 了 ,为 此 
Savitzky 和 Golay 就 计算 出 了 一 系列 不 同 权重 与 轨 -~ 化 常数 ， 以 表 的 形式 给 出 使 读者 可 直接 
使 用 它们 来 进行 平 消 计算 。 显 然 ,re G= 各 0) 的 个 数 也 就 是 窗口 的 宽度 。 为 方便 读者 直 
接 进行 平 潜 , 我 们 将 它们 收录 于 硼 5 2 和 表 5-3 之 中 、 

在 Savitzky 和 Golay 给 出 的 表 中 存在 一 些 错误 ,后 出 T. Steinier 等 对 其 进行 了 修正 ” ,并 
H P. A. Соту 给 出 了 更 一 股 的 形式 和 计算 边界 点 公式 -本 书 给 出 的 表 5-2 及 表 5-3 是 经 过 
BER. 


252 ” 留 口 移动 多 项 式 拟 合 平滑 权重 系数 表 多项式 次 数 ，2 或 3) 
T 


— T 
Nn 25 23 21 19 | ио} | 13 | il 9 7 E 
2 - 253 j i | u ! | B 
一 11 一 138 -A р 
—10 一 33 - 21 一 171 , | 
E $2 | —2 | -76 |- 136 | 
—08 147 15 9 sly - 2h 
一 07 222 юг оё о | -6 | — 
—08 287 з | ons 89 7 13 N 
05 | 343 ss | z | 14 18 42 o | -36 | 
—04 387 | 6% 249 189 to 27 | 87 E 9 - 
—03 422 70 284 221 | 34 122 16 44 14 -2 
—0? 447 a | 3o | Me | оз 17 Й 69 39 3 = 
от 462 78 | 324 | 264 a2 | 162 n a4 54 6 12 
on 467 тә | озге | 269 43 | 167 25 89 59 7 17 
Л 462 78 | 324 | 264 az | ded 2 ва 54 6 12 
02 447 75 309 249 39 14? 21 89 39 3 | 一 3 
03 422 70 282 224 34 122 16 | 44 14 -2 
04 387 63 | 249 | 389 27 87 E s | 一 红 
05 343 54 | 3o | 14 18 42 o | -36 
06 287 43 149 89 7 -13 11 
07 222 30 84 24 | -6 | —78 
08 147 15 9 51 一 31 
09 62 -2 —76 —136 
10 -3 | —2 | - 171 
11 —138 一 42 
12 一 253 | 
几 一 化 常数 7 5175 805 | 3058 , 2261 323 | 1105 13 | 429 231 noa 5 
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#53 ”窗口 移动 多 项 式 拟 合 平滑 权重 系数 表 〈 多 项 式 次 数 : 1 或 5) 


a 25 23 Е 190117 15 13 N | 8 7 
一 12 1265 7 
一 11 一 345 95 
一 10 一 1122|  —38| 11828 
一 09 一 1255 -95| 一 6460 340 | 
-o8 -s5| вв —1300| —ms| 1% 

o —:55| —55 | 一 11220 — —azo 
一 06 590 10| -39401 一 299 uo 
一 05 1503 87 5378 18] 一 198 18 | 
—04 { 2385 165 | 17655 405 ， 135 — 45 15 
—03 3155 235 28190 790 110 一 10 —55 5 
一 02 3750 290 36660 1110 390 60 30 — 30 
Л 4125 325 | 42120 1320 600 120 | 135 78 
00 4253 | —337| 44003] 1393 677 ыз | 1% is 
ol 4125 325 42120 1320 600 120 135 : 75 
o2 3750 290| 36660] їп 390 60 30 30 
[3 3155 235| 28190 790 по | —10 | -55 5 
о 2385 165 | 1765] 405: 一 135 — + 15 
08 1508 87| 6378 18 —198 18 | 
06 590 10 3940 —290 110 
07 — 255 -55 | —11220 — 420 
ов —915| 95| - 13005 | 一 255 i 
09 一 1255| —95| 一 6460 340 | 
10 —1122 —38 11628 
п —345 95 | 
12 1265 | 
归 一 化 常数 30015 6555 | 260015 7429| «e| 16189 | 2431 429 429 231 
三 、 窗 口 移动 中 位 数 稳健 平滑 法 
由 于 平均 数 的 计算 和 最 小 二 乘 估计 是 非 稳健 的 non-robust) 《参见 第 五 章 ), 所 以 对 于 一 
些 存 在 有 奇异 点 的 波谱 ， 前 述 两 种 平滑 法 皆 难 于 给 出 满意 的 结果 。 如 果 用 稳健 的 中 位 数 来 代 
蔡 平 均 数 ， 就 构成 了 窗口 移动 中 位 数 稳健 平滑 法 ， 此 法 的 基本 计算 过 程 与 窗口 移动 平均 法 完 
全 一 样 。 只 需 将 其 计算 公式 作 一 改动 即 可 。 
,平纹 中 一 IDedian( -7 了 一 (一 下) 
此 法 虽然 简单 ， 但 仍 不 失 为 一 个 可 用 的 稳健 平滑 方法 - 


FA. BENTE 


在 前 述 玫 小 节 讨 论 的 平滑 方法 中 ， 窗 口 移动 多 项 式 最 小 二 乘法 在 化 学 波谱 数据 预 处 理 中 
得 到 了 相当 广泛 的 应 用 ， 确 为 一 个 较 好 的 平滑 方法 。 然 而 ， 该 法 也 存在 一 些 弱 点 : O 该 法 是 
一 种 基于 最 小 二 乘 拟 合 的 方法 ， 很 不 稳健 ， 其 月 污 点 为 1/m 《参见 第 五 章 稳健 估计 )， 故 对 于 
存在 异常 点 (outer) 的 数据 ,所 得 结果 将 不 尽 人 意 。 名 该 法 本 质 上 是 一 种 参数 估计 法 ,其 结 
果 与 适当 参数 选取 密切 相关 ， 其 中 窗口 的 宽度 ， 多 项 式 的 次 数 的 选取 就 十 分 重要 ， 不 同 的 参 
数 得 到 的 结果 就 不 尽 相同 。@ 由 于 该 法 实质 上 采用 中 心 点 来 进行 加 权 估 计 ， 所 以 有 边界 点 信 
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ВЕК. ШЫЙК, AKBANK. BRUT ШАТИ, Bp K 
原始 Savitzky 和 Golay 法 广泛 。 所以， 发 展 更 有 效 的 方法 仍 有 必要 。 

本 节 所 讨论 的 粗糙 惩罚 平滑 法 Croughness penalty smoothing method) 是 一 种 非 参 数 估计 
的 方法 ， 故 可 克服 前 述 Savitzky 法 的 缺点 . 该 法 是 出 英国 统计 学 家 Silverman 提出 , 其 基本 思 
路 是 在 最 小 二 乘 估计 的 基础 上 再 加 上 一 个 粗 灶 惩罚 项 ， 其 目标 函数 为 


strand = MG — £Y + a| Lice du, (5-9) 
i=] “ey 


stb, f ЕЕ Т АЯ, ¿G= 1o DHE (包括 电化 学 谱 ) 中 的 量 测 点 数 
E, f. B fw IH f Go) TE aa G= 1," n) EA BO Pe) УЖ а AESA R 
ABE ТЕПЛЕ НЕ PTE. Ж. Hb B bs Н S OO RHEE УД 
惩罚 项 ， 实 因 二 阶 导 数 之 积分 值 是 任 一 曲线 粗糙 性 的 最 好 度量 ， 其 与 样 条 的 张力 能 (strain 
energy) 是 成 正比 的 。 

从 上 述 目标 函数 可 以 看 出 ， 粗 磷 惩 罚 平滑 法 一 方面 注意 到 了 拟 合 的 作用 〈 此 点 优 于 简单 
平均 ), 另 一 方面 , 又 注意 到 了 测量 数据 的 粗糙 性 ， 越 是 粗糙 和 不 光滑 的 测量 数据 中 品 音 的 成 
TRA, VA MEM AWA, AATRE (cross-validation) 来 决定 e. MWA AA б 
数 在 对 拟 售 噪 声 惩罚 达到 最 好 的 平衡 ， 以 最 大 限度 保证 分 析 信和 号 既 不 失真 又 能 除 品 ， 取 得 最 
好 的 平滑 效果 。 在 此 ， 必 须 指 出 的 另 一 点 是 ， 由 于 了 为 任 一 一 阶 可 微 函 数 ， 所 以 此 目标 函数 
为 求 一 泛 函 最 优 问题 。 

正 由 于 这 问题 为 一 泛 函 寻 优 问题 ， 一 般 很 难 用 经 典 方 法 求解 ， 故 此 法 的 求解 方式 是 首先 
转换 成 矩阵 形式 。 继 续 将 其 变形 。 从 而 得 到 它 的 最 优 解 。 

首先 ， 可 以 证 明 


NE = f'Kf (5-10) 


其 中 ,下 Ji (оош. ЛГУ, FT BEBOR B BE п 个 样 点 上 的 函数 值 。 

下 矩阵 可 由 下 列 方法 来 构成 : 

BRS m шы — ш Gol n 1), 883638 ЁЛЕ, BI E Oxo „ШЕШ 
Reon HER Q TERT ih PAREN 

Quam VB í = 10 aah, Qype LB; (5-11) 
j=2, эл—1 
ME MUERE 9,24 [tj] 22 N g SOG Leslee D 
所 以 有 


fh, 0 0 ө 0 
1/h; —lh; 1/h, 9 - 0 
lh, 1/h—1l/h 1/h, 
9 l/hs l/h;—1/h, 
o= 0 0 1/А, 
0 
H lh. 


0 0 0 hy 2 Vier hes) 
0 0 0 0 lh, 1 aXtn=2) 
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FB А 0—0 Oi 2) X (nm--2) 对 称 方 阵 ,其 主要 非 零 元 素 


ra= (h, -ЕҺ)/3 G=2. e .n—1); ©5-12› 
тык Er =ЁА,/6 G2. sn) (5-13) 
mA li j| 2:2 BF r0, BR 
(h +h) /3 һ,/6 0 EE 0 0 
№16 (А, +А,)/3 һ/6 uU 0 0 
0 һ;/6 GucFRO/3 зе 0 0 
0 0 һ,/6 .. 0 
к— 0 0 0 H 
0 
0 - o 
: h, 3/6 0 
(А.А, 2/3 hy 2/6 
| D 0 0 9 h, 216 Ch, ER [e Denn 


如 果 所 需 平滑 的 波谱 (包括 电化 学 谱 ) 是 等 距 ( 等 时 ) 采 样 的 , 则 上 述 两 个 矩阵 QURUE PE ET 
简化 为 


1 0 0 9 
— 1 0 0 
-2 1 0 
0 1 —2 0 
0=| 0 0 1 ; 
0 0 
i i 
-2 
1 0 0 о ins 
2/3 1/6 0 ^ 0 ù 
1/6 2/3 1/6 о о 
о 1/6 2/3 о 0 
9 о 1⁄6 0 
gl? 0 0 
0 | 
o 0 
; 1⁄6 0 
2/3 1/6 
0 0 0 ++ 1/6 Z/3lenxer 
如 果 了 (w) 可 由 一 个 自然 立方 样 条 Cnatural cubic spline) 88 HH. fi ERA w < ==: 
<=, 上 ,下 式 成 立 , 即 
f = бш) Y= fe) G= 1.2, n) 
WA, Жай ЛЖ. Mw, 和 rw Eñ) fn = reini OS. DUI HS ЖИН r. 
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引 理 ， 矢量 fa y FEST АЙН Cao), SES FREE: 
Qf=RY (5-14) 
成 立 。 如 式 (9-10) RE ИЕЛЕП FQ, 
[EF Fdw = уву = лку (5-15) 
此 引 理 的 证 明 可 参阅 文献 [12] 
AURA АГ MGR ЕЕЕ K RERA. AY 


Y=R Qf (5-16) 
Y-fQ( FFER (5-17) 

XE RS — REEF, Е П (5-160 (5.17 3K ipf 
K=QR Q (5-18) 


NPR ATK AER PGR BAER ALE API НА ЖОК RSPR A Т, 
вао] = MG, — £X + e TP 


= (x cQ Р + of Kf 


= xx — 2f'x + PU + aK) f (5-19) 
12.5, 1 4 
i 
12} E 
EN ° 
= x 
5 11.57 < 
u f 1 А nam ass 
G тоо 200 300 400 i00 450 500 556 600 
a 波长 /nm 
(a) (b) 


Axio * 


ot. L n n 
400 450 500 550 600 Foo 450 800 550 600 
该 长 /nm 波长 /nm 
G (4) 


图 5-4 ТТР ee ab aA — 1 3c 
Са) ИРНА, o S0 时 取得 最 小 值 ; (bY озо HEB HAR 
Ce) a=30 时 粗大 平滑 结 果 ;(d) a 一 300 Bf ALR A R 
佐 阵 (I 十 oK) 为 一 严格 正定 答 阵 , 这 说 明 上 式 具有 唯一 的 极 小 值 ， 击 且 使 式 G-19) 成 立 
的 极 小 值 的 解 为 
= О-о) s (5-20) 
这 是 因为 ， 目 标 函 数 SLfGey lal k A 
(£— QE al) x} aK) {f—U+aK) 7x1 +S (5-21) 
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其 中 $ 为 一 与 了 无 关 的 常数 项 ， 从 式 (5-21) 可 以 清楚 看 出 、 只 有 当 f 二 (1+aK) x 时 
SLf(w}], 才 达到 极 小 。 

A х= [а.о 为 已 知 。 天 可 根据 式 (5-18) 求 出 ,只 要 给 定 了 aiá HI MATLAB 标准 程 
序 是 很 容易 求 出 了 来 的 。 

原则 上 说 是 可 由 不 同方 法 确定 ,本 书 介绍 的 是 交 义 校 验 法 (cross validation) AT VL iE. 
В?! ,如 果 我 们 是 采用 一 次 剔除 一 个 样本 点 的 算法 ,其 交叉 校 验 的 总 得 分 可 由 下 式 给 出 - 


CV = x >| = A | (5-22) 


RPA (eK) 而 ALGO Gm, m RR TER LOS BUS TES ВА ВИН. 
有 有关 如 何 构成 此 交叉 校 验 法 的 细节 因 涉 及 过 多 的 数学 推导 ,读者 可 参阅 文献 [12]。 
图 5-4 给 出 了 一 个 用 粗 烟 惩 罚 平滑 法 处 理 的 一 个 实例 。 从 图 5-4 中 可 以 看 出 .由 交叉 校 验 
法 给 出 的 a 的 确 可 以 达到 既 不 失真 又 达到 了 除 噪 的 最 佳 选 择 。 


第 四 节 分析 信号 的 求 导 方法 


在 波谱 分 析 中 ， 导 数 波 谱 为 一 重要 的 方法 ， 如 何 直 接 从 所 得 的 离散 波谱 中 获得 导数 波谱 
一 直 是 分 析 化 学 中 一 个 值得 研究 的 问题 。 本 节 将 对 两 种 常用 的 求 导 方法 进行 介绍 。 


一 、 直 接 差分 法 


身 接 差 分 法 是 一 种 最 简单 的 离散 波 诺 求 导 方法 ， 对 丁 一 个 离散 波谱 xz.(i 一 1,…,n) ,其 采 
样 波长 Go.) REA GO Gl. е, я) 来 说 ， 则 计算 公式 为 


y= Gs 1— 2 / Gu 119) (5-23) 
如 果 采 样 波 长 或 时 间 为 等 距 的 ， 则 式 (5-23) 可 改写 为 
уласа Goleva-l) (5-24) 


在 MATLAB 中 ， 有 一 个 deriv 函数 ， 就 是 用 式 (5-24) 来 进行 计算 的 。 

直接 差分 法 简单 ， 但 有 两 个 缺点 ,一 是 所 求 导数 谱 比 原始 波谱 少 了 一 个 采样 点 ， 而 使 其 
发 生 了 半 个 点 的 位 移 ， 这 对 于 要 使 用 原始 波谱 极 值 点 数据 时 带 来 误差 :二 是 这 种 方法 对 于 分 
辩 率 商 的 波谱 或 是 采样 时 间 点 很 密 的 波谱 所 求 导数 与 实际 相差 不 大 ,但 对 于 一 些 分 辩 率 低 ,上 
采样 点 稀 的 波谱 ， 此 法 所 求 的 变化 率 〔 导 数 ) 就 存在 较 大 误差 了 ， 所 以 在 使 用 MATLAB 的 
deriv 霄 数 时 一 定 要 对 这 两 点 加 以 注意 。 


二 、 多 项 式 最 小 二 彝 拟 合 求 导 法 


在 前 -- 节 有 关 分 析 信 号 的 平滑 方法 中 ， 介 绍 了 Savitzky 和 Golay 的 窗口 移动 多 项 式 最 小 
二 乘 拟 合法 ， 实 际 上 该 法 不 但 可 用 于 平滑 ， 亦 可 用 于 求 导 ， 实 因 其 为 一 多 项 式 拟 合 ， 可 以 对 
此 多 项 式 求 导 ， 就 可 直接 得 到 求 导 所 需 的 窗口 中 心 点 的 加 权 平 均 表达 式 。 此 法 求 导 所 得 的 导 
数 波谱 ， 能 克服 前 述 简单 差分 法 的 弱点 ， 且 导数 谱 不 发 生 位 移 可 精确 求 得 各 采样 点 导数 。 
前 述 求 窗 口 (N= 2m 十 1) 中 的 一 个 中 心 点 z 的 表达 式 ， 即 
aj —acajtafdeectajG-loesG——mesg,sue (5-25) 
一 阶 导 数 ， dz 1) /d =a 2a jd kauf! (5-26) 
X j—oB. 有 d 0/d(),-,—a (5-27) 


170 


二 阶 导数 : С/С = Barter + (k— 10а, (5-28) 
4 j=0 Bh, Æ PAG), = 2 
如 此 等 等 , п] — ЖИН ЖИ 2-DHRER. 窗口 移动 法 实际 上 是 只 使 用 中 心 点 的 信息 ， 
也 就 是 当 j==0 时 的 信息 ， 所 以 有 
ACY ACP) =k a (5-29) 

由 此 可 知 ,如 果 求 得 了 a.G=1,…, 如 就 可 求 出 1 至 二 阶 的 权重 表达 式 。 例 如 窗口 宽度 N= 
2m 十 1 二 9, 以 4 阶 多 项 拟 合 得 到 的 3 阶 的 权重 表达 式 如 式 (5-30) 所 示 。 

х"=( Maie a | 13T + at! Өлі — 1340 Tey +a (5 30) 

Ж 5-4… 表 5-9 EH HEA BR He ATR PA A. 
表 5-4 窗口 移动 多 项 式 拟 合 求 一 阶 导数 权重 系数 表 〈 多 项 式 次 数 IRD 


窗口 宽度 25 23 21 19 17 15 13 n 9 7 5 
—12 30856 7 ww B 
E 8602 3938 
—10 8828 815 81075 
-9 | --20982 一 1518 10030 6936 
—8 | --29236 —3140 —43284 68 — 748 
—7 | -33754 —4130 —78176 -+4548 —98в 12922 
—6 --35003 —4567 —96947 —7481 —643 —4121 1133 
—5 --33450 —4530 101900 —8700 — 930 — 1415. 880 300 
—4 | -29562 一 4098 一 95338 一 8574 —1002 18331 86 
—3 | -23806 一 3350 -79564 一 7372 —900 一 17842 - 1796 ~-532 一 142 22 
—2 | 16649 一 2365 —56881 一 5363 —673  —13843 —1489 — 5803 一 193  —87 i 
-1 一 8558 —1222  —29592 —2816 —358 -7508 -832 —298  —106 —58 -8 
о ° 0 o 0 0 ü ° ° 0 0 n 
1 | 8558 1222 29502 — 2816 358 7506 832 — 298 126 58 8 
2 16649 2365 56881 5365 673 звал 1489 503 193 67 -1 
3 23806 3350 79564 — 7372 902 17842 1798 52 142 一 22 
4 29562 4098 953588 8574 1002 18334 1578 294 —86 
5 33450 4880 101900 8700 930 14150 660 一 300 
8 35003 4567 98947 — 7481 643 4121 一 1133 
7 33754 — 4130 78176 4648 98 — —12922 
8 29236 — 3140 43284 —68 — 748 
9 20982 1518  —10032 —6936 
10 8525 —815 —84075 
11 | —8602 - 3938 
12 | -30866 EM 
Ak 1776060 197340 3634092 255816 232056 334152 24024 5148 1188 252 12 
RSS 窗口 移动 多 项 式 拟 合 求 一 阶 导 数 权重 系数 家 《多项式 次 数 5 或 6) 
窗口 宽度 | 25 23 21 19 17 15 13 11 9 E 
一 12 | —8322182 7 
-u 6024183 — 400653 
一 10 9604353 359157 —15033086 
一 9 6671883 489687 16649358 一 255102 
-8 544608 265164 19052988 349928 —14404 
—7 | 6301491 —108911 6402438 322378 — 24561 ^ — 78351 


Hk 
26 28 21 15 17 13 m 9 7 
|-12139321 — 478349 —10949942 9473 16679 169819 —9647 ` 
`-15896511 — 752859 — 26040033 348823 — 8871 65229 27093 一 573 
17662146 —878634 — 24807914 --604484 —32306 一 130506 12 2166 — 254 
[-155э3141 一 840937 一 35613829 --886099 -43973 一 266401 —3351] -124 11 —1 


11820675 一 654687 —28154154 —383549 一 40483 一 8741 一 3774 -2269 9 
:--6356625 一 357045 一 15977364 -332684 一 23945 5 31380 一 3084 —2879 —15 
i 0 ° ° ° 0 D ° o ò 0 


1 6356625 357045 10977364 332684 23945 175125 31380 3084 2878 — 45 
2 11820675 654687 28754154 583549 40483 279975 45741 3774 2260 —9 
3 15593141 840937 35613829 686099 43973 266401 33511 — 1249 —1381 1 
4 17062146 878634 34807914 604484 32306 130506 12 —2186 254 
5 15896011 752859 26040033 — 348823 8671 — 652008 -27093 518 
6 12139321 478349 10949947 9473 16679 169819 9647 
7 6301491 106911 - 6402438 —322378 —24661 78351 
8 | —544668 —265164 —19052988 —349928 — 14404 
ә | 一 6671883 一 489687 ~ 16549358 255102 
10 | —9604353 —359157 15033066 
11 | —6024183 400653 
12 . 8322182 
AE 429214500 18747300 637403200 9806280 503880 2519400 291720 17160 8580 60 


#56 窗口 移动 多 项 式 拟 合 求 二 阶 导 数 权 重 系数 表 〔 允 项 式 次 数 2 或 3) 


25 23 21 19 17 15 13 11 9 7 5 
92 
69 7 
48 56 195 
29 37 133 51 
12 20 82 34 40 
一 3 5 37 19 25 91 
—16 —8 一 2 rj 12 52 22 
—27 —18 —35 m 1 15 n 15 
—36 一 28 一 62 -H —8 一 8 2 6 28 
—43 —35 —83 —21 —15 — 29 一 5 —1 7 5 
一 4  —40 —93 一 26 —20 -4 —10 —6 一 8 в 2 
—51 —43 一 107 —29 一 23 一 53 一 13 —8 一 17 一 3 一 1 
—52 —44 -180 一 30 ~24 —55 —H  -10 一 20 一 4 -? 
—51 —43 一 107  -?9 一 23 -53 一 13 一 一 17 一 3 一 上 
—48 —40 798  -26 一 20 -4 —10 —6 —8& ° 2 
一 43 一 35 一 83 —21 一 1 —29 一 5 一 1 7 5 
—36 —28 —62 —14 —8 —8 2 6 28 
一 27 —18 一 35 —$ 1 19 п 15 
一 16 —8 一 2 6 12 52 22 
一 3 5 37 19 25 91 
12 20 82 м 40 
29 37 133 51 
48 56 190 
69 77 
92 


26910 17710 33649 6783 3876 6188 1001 429 462 42 7 
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表 5-7 窗口 移动 多 项 式 拟 合 求 二 阶 导数 权重 系数 表 (SMAKK 4 或 5) 


窗口 宽度 Docs 23 21 19 17 15 13 u 9 7 
Tiz | —143198 7 I 
一 11 10373 一 115577 
—10 20615 = 12597 
-9 93993 3876 —32028 
-8 š 119510 11934 15028  —2132 
-7 1:2067 110545 13804 — 35148 — 1443 —3103] 
z 49193 T8902 — 11451 36357 26901 29801 一 2211 
一 5 8285 34815 6878 25610 205 41% 2970 -90 
-4 — 33342 —13062 626 8792 1256 31856 3504 174 —126 
-3 = 79703 — 57645 — 5226 -9282 207 5579 1511 146 371 —13 
一 2 一 116143 一 93425 一 10061 24867 -1557 19751 -971 1 151 67 
—i | -139337 —118467 19224 —35288 — —2489 —38859  —3018 — -136 211-19 
o | -119290 12410  —14322  —38840  —2820 -45780 一 3780 — -190 —370 —70 
1 | 139937 —116467  —13224 35288 —2489 — —38859 一 3016 — —136 —1 —1% 
2 | -06142 93425 -10061 -24867 一 1557  —197804 — 971 1 151 67 
з | —79703 一 57645 — —5226 9242 — 207 699 1814 146 зп 一 13 
a | 一 33342 —13062 526 8792 1256 31856 3504 174 —196 
5 18285 34815 6578 25610 2405 44495 2970 一 90 
6 69193 — 78903 11451 36357 21 29801 — 2211 
1 112067 110545 13804 Зав маз = 31031 
8 138262 119510 11934 15028 — 2132 
9 137803 93993 3876 — - 32028 
10 90385 20615 —12597 
n 10873 —115577 
12 — 134198 
TÉ 17168580 11248380 980628 1961256 100776 1118536 58344 1716 1716 132 
$585 窗口 移动 多 项 式 氢 合 求 三 阶 导数 权 重 系数 表 (多 项 式 次 数 3 或 4) 
窗口 宽度 25 23 2 19 17 15 13 n 9 ? 5 
EU 二 506 u 
-n 一 253 -77 
一 10 —55 -35 285 
=] 93 -3 -1M 一 204 
Е 196 20 12 68  -28 
一 ? 259 35 98 ж т 91 
—6 287 43 149 89 7 —13 一 11 
-5 285 45 170 120 15 35 e - 80 
一 4 258 42 166 126 18 38 6 6 -H 
-3 2 35 142 112 17 Л 8 22 ? a 
-2 145 25 103 83 13 49 1 23 13 ' — 
E т 13 54 En T 27 4 14 9 1 2 
° ° ° ° 0 a 0 0 0 0 ° ° 
1 一 77 一 13 一 54 — 44 一 了 一 27 4 一 14 一 9 一 1 一 2 
2 —14 -55  —10 -9 -13 -4 — -3 BD 1 
3 —211 —35 —142 — 112 一 17 —61 —8 一 22 一 了 1 
4 258 42  -—186 126  —18  -58 -6 —6 n 
E —285 45 —10 120-18 35 0 30 
6 —287  —43 -149 -89 — 77 13 n 


RR 
窗口 宽度 25 23 al 19 17 18 13 n 9 7 5 
7 -359 ^ -35 с -% 7 4 7 7 i 
8 -196 -20 12 88 2 
9 | —93 3 14 204 
10 БЫ 35 285 
n 253 77 
12 506 
归 一 化 常数 | 296010 — 32890 86526 — 42636 3876 7958 от 858 198 6 z 
表 5-9 窗口 移动 多 项 式 拟 合 求 三 阶 导数 权重 系数 表 (多 项 式 次 数 5 RG) 
窗口 宽度 25 23 21 19 17 15 13 HI 9 7 E 
=12 284372 u 7 ~ 
一 11 — 144463 49115 
一 10 i — 293128 —32224 748068 
一 9 266403 一 55233 一 625974 15810 
—8  |—146408 一 43928 —908004 16796 — l4 
-7 5131 ~ 16583 —598094 —20342  —1517 8281 
—6 | 144616 13632 一 62644 -9818 - 1508 —14401 1430 
一 5 244311 38013 448909 4309 —331 一 10379 一 3267 — 128 
一 4 290076 51684 — 787382 15546 876 — 1916 —1374  —402 100 
-3 270101 52959 887137 20525 1595 1187] — 1633 一 1L 一 457 1 
一 2 217640 — 42704 749372 — 18554 1604 14180 — 3050 30 256 8 
-1 118745 23699 425412 10868 983 9315 2252 315 459 13 
0 0 0 9 0 ° o ) ° 0 
1 | 118245 —23699 —425412 一 10868 -983 —9315 一 2252 —315 -459 - 13 
2 | 217640 一 42704 —749372 一 18554 —1604 —14180 --8050 =39 — 256 в 
3 |- 279101 52959 一 887137 —20525 —1595 —11671 一 1633 H 487 -1 
4 | 290076 —51684 一 787382 一 15546 —876 1918 1374 40; 一 100 
в | ~244311 一 38013 一 448909 — 4329 351 10178 — 3267  —123 
6 | -144616 —13632 — 62614 9818 1508 14404 1430 
7 —5131 16583 598034 20342 154? —8081 
8 146408 43928 908004 16798 — 1144 
9 266403 55233 625974 — 15810 
10 293128 32224 — 748068 
11 144463 -49115 
12 | — 284372 _ _ 
轨 一 化 常数 | 57228600 7498920 84987760 1307504 67184 335920 38896 — 2288 114 8 
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设 有 一 光谱 线 , 以 了 (x) 表述 ， 


第 五 节 分 析 信 号 的 变换 方法 
一 、 卷 积 运算 的 物理 意义 


变换 方法 是 分 析 信号 预 处 理 中 一 种 很 有 用 的 方法 。 很 多 变换 方法 就 是 直接 内 置 于 分 析 仪 
器 之 内 ， 由 仪器 量 测 所 得 数据 就 已 是 通过 这 样 变换 预 处 理 的 。 本 节 将 要 讨论 的 卷 积 运算 、 光 
谱 多 重 效应 的 Hadamard 变换 就 是 这 样 的 例子 。 此 外 , 对 于 在 光谱 特别 是 红外 光谱 中 得 到 极其 
广泛 使 用 的 傅 里 叶 变换 将 在 本 节 给 出 较 详细 的 介绍 ， 而 对 于 近年 来 在 近代 数学 得 以 迅速 发 展 
的 小 波 变 换 及 其 在 分 析 化 学 中 的 应 用 ， 则 是 本 节 介绍 的 重点 ， 

卷 积 是 统计 学 中 一 个 十 分 重要 的 概念 ， 在 分 析 信 号 处 理 中 有 着 十 分 重要 的 意义 ， 为 便于 


真实 图 形 如 图 5-5 所 示 , 用 光谱 仪器 记录 这 一 谱 线 , 即 
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LL BORED x TA RRE H, 8 
"i (0 НОВУ Ы СЬ) 完全 相同 ,但 实际 的 光谱 仪 
天 的 狭 链 均 有 一 定 宽度 。 设 这 一 疼 颖 可 用 函数 h(x) K 
述 ， 如 图 5-5 中 GO Et. MAGIA, KAR 
B EAERI RRR, ЖЕЛШ * Ë F ER 
受 的 光 强 达到 狭 儿 中 心 点 所 对 应 的 光 检 测 器 的 分 数 ， 
也 就 是 说 ， 凡 经 狭 双 透 过 的 光 均 有 一 部 分 会 达到 中 心 
点 所 对 应 的 光 检测 器 ， 函 数 上 即 是 达到 中 心 点 光 强 的 
量度 。 作 为 示意 图 ， 图 5-5 给 出 的 是 狭 颖 中 心 点 位 于 
zx 二 11 时 的 情况 。 

从 图 5-5 可 以 看 出 ， 这 种 光 狭 锋 移 动 答 测 光谱 曾 
使 光谱 变 宽 的 情况 ， 与 前 面 讨论 的 窗口 移动 平滑 法 是 
相似 的 ， & Co) 函数 就 相当 于 板 函 数 ， 故 Savitzky 和 
Golay 前 述 的 窗口 移动 多 项 式 拟 合法 就 称 为 卷 积 法 .如 
@ 设 g Со) 为 光 检 测 器 测 得 的 光谱 (参见 图 5-5), BA, 
由 于 狂 色 冯 数 的 作用 而 使 其 相当 于 原始 的 光谱 f(x) 

А 变 宽 了 ， 此 时 ， 量 测 到 的 谱 线 z GO 为 


f(x) 
T 


EI 
Б 
© 
8; 


gr] = fe) ale — z] 45-31) 

图 5-5 光谱 狭 各 对 谱 图 量 测 < 
Юл: 式 (5-31) 即 为 卷 积 运算 的 离散 表达 式 , 与 前 述 窗 
D PER ACs 口 移 动 加 权 平 均 是 类 似 的 。 同 时 ,从 式 (5-31) 可 以 看 
оо ROGA fC: 出 ,N 一 2m 十 1 为 狭 颖 宽度 , 式 (5-31) 表 示 的 是 以 гї) 
(O UEBER OUI ео 为 中 心 点 时 的 量 测 光谱 之 强度 。 注 意 到 狂 甸 函数 

(z) ,在 狭 甸 宽度 之 外 此 为 零 , 所 以 式 (5-31)? 如 用 连续 形式 表 出 则 变 为 

801 = | "ана — ade (5-32) 


MEOH v, SAT 
#0) = [renro E (5-33) 


式 中 ,g(y) 称 为 函数 f(x) 与 h(y) 的 卷 积 , 记 为 f(x)，h(y)， 卷 积 亦 称 裙 积 , 取 有 aS 
miaz. 

在 光谱 宽度 的 例子 中 ,f(z) 是 未 受到 挠 动 的 谱 线 (原始 谱 线 ),h(y EERE, gO) 
是 其 测 到 的 谱 线 。h(y 一 +) 这 个 变 宽 函数 不 一 定局 限于 上 例 所 述 狭 链 有 限 宽度 引起 的 变 宽 。 任 
何 一 种 光谱 变 宽 都 可 以 用 卷 积 积分 来 表述 ， 如 原 于 光谱 线 的 多 普 勒 变 宽 ， 碰 撞 变 宽 等 。 以 后 
我 们 还 可 以 看 到 ， 利 用 傅 里 叶 变 换 可 很 容易 地 进行 卷 积 的 重要 送 算 ， 卷 积 运算 实质 上 也 是 一 
种 变换 运算 。 


二 、 光 说 多 重 性 效益 与 Hadamard 变换 


光谱 分 析 的 多 重 性 效益 的 基本 思路 可 以 称 量 试验 设计 来 加 以 说 明 59。 设 有 4 个 未 知 重 量 
ВЕН, BUE ERE T BUE, 设 称 芋 得 到 方差 为 , 则 单独 称 景 z G— 1,2, 4 0890 
的 结果 的 方差 为 只。 但 如 设计 一 试验 ,同时 将 此 4 个 合金 样 以 不 同 组 合 置 于 双 天 平 两 侧 , 如 : 
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im z Far tate (5-34a) 
m,—z,—2,— 1,45, 6 (5-34b) 
my=a,— a, +2,—1,+¢5 (5-340) 
(т. =. Батат, фе, (5-34d) 


即将 4 个 合金 样本 全 置 于 左 盘 加 法 码 mice, UT Ze Hos 置 于 右 盘 加 法 码 m;; 余 
类 推 。 由 上 述 方程 组 可 求 出 z+, 例如 z, 的 估计 值 
жү = l/AOn + m, + m, + m.) = x, + ANS 
可 见 ， 此 时 误差 为 原 误差 的 1/4， 即 方差 为 7/16. 
前 述 的 单一 称 量 [ 式 《5-34)] 可 表述 为 〈 略 误差 项 ) 


т) rn 0 0 ofa 

m| 10 1 0 0 iz 
=| (5-35) 

m, ЕЯ 

loo 101 

т) ооо Lia 

E 

m= Ах (5-86) 
x=A 'm=Am (5-37) 


在 此 A — A. 这 种 计算 固然 十 分 简单 ,但 每 一 样本 只 称 量 了 一 次 ,而 前 述 经 试验 设计 方 
Ж. 网 样 略 去 误差 项 ， 可 写 为 


m] p 1 1 yei 
m 1 -1 —1 1115 
? | И (5-38) 


1-1 1 -ll|x 
m) do 1 =l -Hls 
xk (5-38) 右 侧 的 矩阵 称 为 Hadamard ER, ie H. MWE 
m=Hx (5-39) 
BR. 吾 的 各 元 素 Al ХИН 
IH,.|=1 
ШАП HAD f] E: 
1 


1 一 二 5- 
H =W" (5-40) 


这 一 称 量 试验 设计 思想 ， 被 用 于 光谱 分 析 中 的 试验 设计 ， 传 统 的 扫描 方法 测试 光谱 ， 每 
次 测 一 个 波长 的 光 强度 , 如 改 为 同时 测定 多 个 波长 的 光 强 度 , ЖЖ N 个 波长 ,进行 N 次 不 局 
的 组 合 测试 ， 应 能 减少 测试 误差 ， 或 改善 光谱 量 测 的 信 噪 比 。 按 上 述 方法 设计 试验 ， 要 有 十 
1 与 一 1 两 种 取 值 ， 如 改 为 十 ] 与 0 两 种 取 值 ， 则 技术 上 较 易 实 现 。 实现 这 种 测试 光谱 的 具体 
方法 ， 是 将 色散 系统 的 人 光 狭 又 或 出 光 狂 锋 ， 由 单个 波长 《或 最 小 分 辨 ) 狂怒 改 为 打开 整个 
测试 光 域 ,但 装置 障 板 迹 盖 一 部 分 波长 ， 让 其 他 波长 处 的 光 通过 。 设 需 测 试 7 个 波长 处 的 光 
强度 图 G1, 2，…，7)， 传统 的 方法 是 将 色散 系统 转动 使 加 到 yr COGOR SE TR DAR 
每 次 测 一 个 几 。 而 仿照 称 量 试验 设计 装置 的 分 光 计 ， 则 可 同时 测定 若干 风 。 如 设计 的 障 板 在 
9; PERM, Та 1хфу, 如 在 具 处 有 障 板 使 光 不 能 通过 , 记 为 Xg. 这 种 0 一 1 障 板 如 有 
下 列 顺序 1001011， 则 测 得 的 总 光 强 为 

$ =1X#-T0X4-0X441X6-F0X06 LXIX 
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=b +T T 
只 要 能 设计 7 个 相互 独立 的 量 测 组 合 ， 测 出 7 个 总 5 值 ， 即 可 解 出 各 po ОЛЕ ЕЕ 
这 种 组 合 之 一 : 


(5-41) 


ç 
s 
sr er. 
meu enoo 
corer e ° 
= u cone 
re 
ser e 


0 111 
式 (5-41) 这 一 矩阵 称 为 Sylvester ME, RA Halamard EBE S Hi, AMAA ATS 
最 后 的 元 素 置 于 下 行 最 前 作 第 一 元 素 ,而 1 一 6 PRWEB- ГНЕ 17, RAM. -Mit 
来 ， 如 需 量 测 N 个 光谱 单元 ,，$ 矩阵 由 元 素 S, 组 成 ，8, 取 值 为 0 或 1 共有 工 个 组 合 ， 每 个 
组 合 G1) D) 测 得 的 光 强 将 为 六 So%， 加 量 测 误差 得 


К 

Үе S e @=1 10 (5-42) 

这 种 量 测 方法 可 称 为 光谱 量 测 的 编码 过 程 , 这 里 用 的 是 Hadamard 编码 , 这 样 设计 的 光谱 
仪器 称 为 Hadamard 变换 光谱 。 


借 Hadamard 编码 构造 光谱 仪器 并 不 需要 制作 N 个 这 种 不 同 组 合 的 障 板 。 例 如 NN 二 3 时 ， 
可 构造 一 个 (11011) HRR, 其 最 左 3 个 位 置 相当 于 110, 向 右 移动 一 个 位 量 测 ， 得 101， 再 
称 一 位 ,得 011。 即 得 N —3 的 Hadamard BRE. 这样, 构造 一 个 含 2N 一 1 RAMA, 0] 
代替 N 个 独立 障 板 。 对 任意 N=2r—1 (7 为 正 整数 》 均 可 实现 这 样 的 锋 钾 系列， 得 到 例如 


M 1 1 0) mW] 
x =11 9 10% (5-43) 
yl 10 1 1 ñ 
即 
у=$ф (5-4) 
ф=5 'y (5-45) 
S-! 可 通过 将 $ 中 的 0 换 成 一 1 BH, X (5-45) 5 "为 
fl lol 
=- 1-1 ] (5-46) 
—1 1 H 


因此 ， 解 码 过 程 是 十 分 简便 的 。 
Hadamard 编码 使 光谱 分 析 信 品 比 提高 N 十 1) 258, 在 N 很 大 时 ， 约 为 N'*/2 f. 
这 种 光谱 多 重 性 效益 , 又 称 Feligett 效益 , 其 原理 与 前 面 称 量 设计 中 说 明 的 误差 降低 的 情 
况 相同 ， 用 Hadamard 变换 设计 的 红外 光谱 与 常规 红外 光谱 比较 ， 确 有 改善 信 品 比 的 效果 。 
Hadamard 变换 与 下 节 讨 论 的 博 里 叶 变换 的 不 同 处 , 在 于 它 是 基于 方 波 型 函数 ,而 全 里 叶 
变换 则 是 以 三 角 函数 为 基础 的 。 除 实现 多 重 性 效益 外 ,Hadamard 变换 还 用 于 多 重 性 分 析 与 数 
所 变换 ， 例 如 信号 压缩 ， 化 学 模式 识别 中 特征 参量 抽取 等 。 一 般 认为 傅 里 时 变换 是 更 强 有 力 
的 分 析 信 号 处 理 的 手段 ,但 Zupan 证 明 59, Hadamard 与 傅 里 叶 变 换 用 于 红外 光谱 信息 的 压缩 
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效率 相同 , 而 Hadamard ЖЕЛЕЗЫ BEL BEG LOT eB — QU I MES Epi ЛЕШ 
BE, BOR Hadamard 变换 由 于 只 含 加 减 运算 ， 速 度 约 为 快速 传 里 时 变换 的 8 一 10 倍 。 


三 、 伟 里 叶 变换 用 于 分 析 信号 处 理 


任何 随时 间 变 化 的 性 质 均 可 以 分 解 为 其 谐 波 组 分 ， 声波 是 最 典型 的 例子 。 某 种 乐器 的 复 
杂 声 波 可 借 多 种 音频 振 葛 器 组 合 将 其 重 更 出 来 而 反 过 来 , 人 们 聆听 一 个 交响 乐团 演奏 时 ,可 
分 办 出 单个 乐器 的 声调 和 它们 奏 出 的 特定 旋律 ， 人 耳 在 这 里 所 作 的 工作 实际 就 是 本 节 要 讨论 
的 待 里 时 变换 。 傅 里 叶 变 换 这 一 强 有 力 的 数学 工具 的 建立 ， 本 身 就 是 人 类 认识 自然 能 力 的 体 
现 。19 WALI, J.B. J. Fourier 在 其 繁 忆 的 社会 活动 及 研究 埃及 文明 ， 出 版 21 卷 巨著 之 余 ， 
在 数学 、 物 理学 方面 也 作出 了 非 上 的 贡献 。 他 研究 热传导 的 分 析 理 论 ， 证 明 可 用 正弦 与 余 兹 
组 成 的 级 数 表达 热传导 过 程 ， 这 就 是 熟知 的 数学 分 析 中 的 优 里 叶 级 数 ， 傅 里 时 将 这 些 概念 推 
演 到 健 里 叶 积 分 。 这 些 数学 工具 使 人 们 习惯 的 时 域 波 形 可 变换 到 频 域 进行 考察 。 这样 杰 出 的 
科学 成 就 远 远 超出 了 候 里 叶 同 时 代 的 许多 人 所 能 理解 搂 受 的 程度 ， кш нш КЇ? 年 
(1828 年 ), [I 58 BEKEL ILU (USE S Im eoe "Bot Ios RE LE” 认为 用 数学 上 这 
ЖЕЕ ЖИИ RT BE a), 储 里 叶 理论 的 价值 在 他 去 世 后 一 个 多 
HAAS ARERR, 

傅 里 上 时 级 孝 得 出 的 是 离散 频谱 ， 是 时 域 的 波形 变换 中 的 频率 信息 。 传 里 叶 级 数 可 写成 


z() = а + > aocos(ment) + b,sin Greet) (5-47) 
= 


式 中 w= 27, 
fit 
a, 代表 了 “直流 项 ,由 x e T ELS A SME , 


а = A fewer (5-48) 


其 余 系数 ad. 为 
a= Ff сокон 


; 
= Hi т(зїйп оно) д Q = 12,3) 
А 


FR UEA8 HE up 4 VEREOR T 这 与 棱镜 或 光 顶 将 化 学 激发 光源 发 生 的 光 分 解 为 不 同 波长 
的 谱 线 是 完全 类 同 的 。 

傅 里 叶 级 数 是 研究 周期 函数 的 工具 ， 而 傅 里 叶 积分 则 用 于 研究 非 周 期 函数 。 PRESS E! 
@@ OF BLA}. Ф cos 2n fot) AGAR 


TS 
2 
e Ги 


2j 


cos mn fut) =Š (5-49a) 


sin(2anfot) = (5-49b) 


BER , Шш n BCT REA 
xt) = M Cem (5-50) 


C, HE n BF оо, 5, 1,001,250 007 BE 
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1 
1 (= 

С, = zl pre mide (5-51) 
TJ $ 


对 于 每 С, 将 待 出 ORARE /二 nf 的 谐 波 组 分 的 振幅 和 相 。 有 了 这 些 基本 概 
念 , 将 直接 给 出 传 里 叶 变换 的 定义 。 
设 有 时 间 函 数 GO ,其 傅 里 叶 变换 表达 式 为 


0 = E (De ide (5-52) 


如 对 参量 /频率 变量 的 每 一 个 值 , 该 积分 都 成 立 , 则 上 式 确定 了 G) MB Drai IXA. 
这 里 按 习惯 将 时 间 函 数 写 为 zt1) , HERR EX). ARAL, 在 光 洪 化 学 分 析 中 从 
物质 的 电磁 波 解码 得 到 光谱 ， 实 质 上 就 是 求 取 这 个 电磁 波 的 傅 里 叶 变 换 ， 楼 镜 与 光栅 从 某 种 
意义 上 说 ， 是 强 有 力 的 候 里 叶 变换 大 。 这 一 事实 本 身 就 决定 了 人情 里 叶 变 埃 这 一 数学 工具 对 化 
学 量 测 的 特殊 意义 。 傅 里 叶 变 换 不 限于 变换 激发 光源 发 生 的 波形 为 频谱 ， 它 能 将 各 和 神 不 同 的 
汲 形 从 时 域 变换 到 频 域 ， 例 如 在 电化 学 量 洞 中 的 应 用 。 

候 里 叶 递 变换 定义 为 


zu) = Г хета (5-53) 


借 式 (5-53) 可 由 XX(/) 反 过 来 确定 oe GO oig А Е (5-52) 5 (5-53) NAD ZE IN S: Ж 
x O5 BUS ХО) ZA ЖИП AE EHR» р 


ХО езх) (5-54) 
QUE TEX TUE E 
(D 线性 加 合 性 
zG@)+yQ)eSX(/)+YCOD (5-55) 
(2) 对 称 性 
xGCxCc f) (5-56) 
(3) ESR ARSE HE 
rade Х{ 2) (5-57) 
L xz eX (5-58) 
(4) 时 移 性 与 频 移 性 
zt) SX ee 2% (5-59a) 
дех f.) (5-59b) 


(5) 实 偶 奇 函数 变换 特性 

ЗА: а.) =т,(—г}. EAO AED) 

WRB on (00 — ло), Д хо) jXol f) 

(=) 离散 情 里 叶 变 接 及 光谱 和 多重 性 效益 

在 化 学 信号 预 处 理 中 ， 一 般 用 到 的 是 离散 传 里 时 变换 ， 是 化 学 量 测 如 数字 化 光谱 或 电化 
学 量 测 中 常见 的 情况 。 如 将 z(t) 的 各 离散 值 在 均匀 时 间 间 隔 A 进行 记录 ,可 得 序列 样本 值 ， 

z—a) — 0 n-,—3.—2,—1.0,1.2,8,7 

时 间 区 间 的 倒数 1/5 称 为 采样 速率 , 如 A 以 秒 计 , 则 1/A 是 每 秒 记录 的 样本 值 个 数 。 采 样 定 
理 "还 定义 一 特征 的 频率 So. 8 Nyquist 临界 频率 : 
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fo=l/2d 
例如 , 对 一 正弦 波 ,临界 池 样 频率 是 每 周期 在 两 点 采样 。 根据 采 样 定理 , PA Re) 
是 分 析 信号 ， 设 其 频率 的 最 高 值 限于 f。(Hz)， 要 确定 在 时 间 了 内 的 状态 ， 握 需 知道 全 部 瞬 
时 值 ， 而 仅 需 知 道 该 分 析 信 叶 函数 在 一 些 离散 时 刻 的 样 值 ， 这 些 样 值 一 经 确定 ， 该 分 析 信和 号 
波形 就 可 完全 由 这 些 采 样 值 再 现 出 来 通过 在 量 测 的 周期 内 均匀 等 距 采 集 2/ T ДЕ, 即 可 取 
得 这 一 分 析 信 和 号 所 包括 的 全 部 信息 ， 这 对 设计 数字 化 的 分 析 仪 器 具有 重要 意义 。 在 此 仅 就 有 
限 个 采样 点 读 取 的 时 域 机 数 的 离散 傅 里 叶 变换 加 以 阔 述 。 
B: 采集 М 个 序 贯 样本 值 


te=altg) HRA R—0..2900.N—10 


式 中 ,入 是 采样 


区 间 ,为 笨 化 讨论 , 设 N 是 偶数 。 


J x08] X GO HBAS 至 fa 内 不 谋求 得 到 所 有 S 
部 分 离散 f, FRX: 


f=n/NA n=—2/N e 


达 的 连续 傅 里 时 变换 : 
z(t)e aide = AS X. геч» = 


iN, 
式 中 ,n 的 最 大 最 小 对 应 于 Nyquist 临界 频率 所 限定 的 频 域 上 


Fa X COM TR ЖОР 


2 (5-60) 


F 限 。 现 试 以 离散 值 之 和 近似 表 


xdo-[. 


Га 
- AX Xke mU) s 
Ёз = 


= aS Xe 09) 


к=з 


这 就 是 所 谓 离 散 傅 里 叶 变 换 (Discrete Fourier Transform DFT) , 亦 即 
Saa "(3 


f 


POL G-6D 


EE n] 16 р BO 


1: ӨК 5 
从 上 述 式 (5 61) 及 式 (5-62) 可 以 看 出 ;只 要 对 时 域 信号 (例如 用 宽 光 域 的 检测 器 ) 在 N TFE 
时 刻 进 行 采样 ,得 到 N 个 时 域内 的 数据 点 GOR >C), Tk OT ë DFT 
转换 为 频 域 的 振幅 序列 ХОЛ Х Con) ,这 样 ,光谱 多 重 性 效益 同样 可 借 傅 里 叶 变 换 来 实现 ,对 
F Hadamard ЛЕ ,m= Ex, 可 以 采用 由 傅 里 叶 变 换 编码 组 成 的 矩阵 来 实现 光谱 多 重 性 效益 ， 
Bp 


XG) = (5-62) 


т= Ех (5-83) 
FHER Fn 为 
F,,—exp(xjmn/ № —cos(23mn/ N) 4- jsin(2nmn/N) 《5-64) 
sth, = /—1, ЙЙ!К„]=1. Ф N=4, 将 有 
|n 1i [т 
N 1 j —1 J| 122 
m | —1 d ille 
m U —j —1 і 


值得 提出 的 是 ， 用 Hadamard 变换 ， 每 次 只 能 量 测 一 部 分 病 率 的 信号 ， 而 DFT 则 可 每 次 量 测 
所 有 频率 的 信号 ， 信 了 品 比 的 改善 将 为 Ni 。 

(E) FFT 及 其 在 光谱 与 电化 学 量 测 中 的 应 用 

前 小 节 所 述 的 高 散 伟 里 叶 变 换 (DET) 适用 于 计算 机 运算 。 如 定义 w у — 9, 
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MJ DFT 的 表达 式 改 为 
Хо) = Уза" (5-66) 


і 
按 式 (5-66) 来 计算 ,对 每 一 个 和 CD) REN 次 乘法 .CN 1) 个 复数 加 法 。 如 此 ,即使 使 用 
计算 机 ,计算 量 也 十 分 大 。 
侠 速 傅 里 时 变换 (Fast Fourier Transform,FFT) 的 基本 思路 是 分 解 式 (5-66) ,以 减少 运 
F. 在 N 是 以 2 为 底 的 宕 次 时 ( 即 N= a 为 正 整数 ) ,这 种 分 解 十 分 方便 , 现 以 N 一 2 一 4 为 
‘ALAIN VA EBA, Др 


E 
XG) = Mr Фи" n= 0.1.2.3 (5 67) 


= 
式 中 记 n (008 x GO VUROR TEAR AL CTE A НО r(6) 项 ,将 式 (5-67) 展 开 , 将 有 
X(0) =x (0 ww H-2 CI) r Yu + r GYw? 
XO) a OD + ro Dw + r. (2) + z (3) 0% 
X(2)=2,(0)w mas (2) tx, (2)et ri 3) ws 
XB) =z, (0)w ta Ow 4-2 (Q Ya tz G)w? 


KON fet w^ uw wi") |< (0) 
хо) jw? w as wn OD 


wow! _ 
ro Te wt w wu (5-88) 
GO] [e° at x utin, 
或 
Xind =W" r (RY (3-89) 
因 mw 一” BL me 1, Be pp 4 Gs ) 为 正 整 数 4 时 
wise Sea ето] 
JS PES їп а BRYA tpi, REN Gm / ООЖ А ИШ LAAN m = 6 时 
бетинен e Wg m а ооз 92 
由 此 , 式 (5-68) 可 进一步 简化 为 
XC] fl 1 1 11[/C0) 
XO| How ow «| _ 
XQ) d ow) ш a| lan e 
(3). low? wi UO 
HB 
tpi e FUE we 9"? cos(5/2) — sin(n/2) 5 —3 
TASA Lc e 172 — cos (31/7) — jsin (31/2) = j 
wi cce PP cse" сов (п) — jsin(m)= —1 
故 式 (5-70) 变 为 
X(0) |! 1 1 1] [4ь09) 
[хо Ol =i =i je) бт) 


z2] 1—1 1 —1] foe) 
xcd ao j —1 ер) 
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TENE ARE ERR SEIS A AE AS 如 果 再 用 二 进 制 来 替代 复数 运算 ， 
则 可 使 傅 里 叶 变换 将 乘法 由 N 次 KERSE 2 次 . 在 此 , N—2', dll a—lgN., ШШ N=1024= 2, 


计算 量 由 原先 1024° 降 到 一 ~ 
之 称 。 

对 于 光谱 化 学 来 说 , FFT 提供 了 极其 强 有 力 的 计算 手段 . 根据 有 关 红 外 谱 图 标准 的 要 求 ， 
标准 谱 图 元 取 2cm-' 分 辩 率 ， 并 至少 在 带宽 (3800~450) cm ' 下 摄制 ， 如 用 Michelson TH 
仪 摄 谱 ， 每 个 干涉 图 片 谱 需 采集 8192 个 数据 点 ，FFT 的 计算 量 仅 为 一 般 离 散 储 里 叶 变 换 
(DFT) & 1/1250。 就 是 因为 FET， 才 使 得 FT-IR 仪器 成 为 事实 。 

在 电化 学 仪器 设计 中 , 广泛 应 用 计算 机 联机 处 理 数据 ?1，FFT 是 重要 工具 之 一 , 在 化 学 
量 测 中 ,相关 的 频 域 是 由 直流 到 若 十 MHz， 较 光谱 化 学 的 频率 低 得 多 ， 这 时 在 时 域 进行 直接 
离散 采样 比 光 谱 化 学 量 测 容易 实现 。Smith5"] 在 综述 傅 里 叶 变 换 用 于 电化 学 分 析 数据 处 理 时 ， 
曾 展望 FFT 的 应 用 将 为 化 学 工作 者 最 熟悉 的 诸如 对 数据 变换 手段 一 样 普及 。 现代 电 分 析 化 学 
技术 ， 基 本 上 是 一 种 张弛 量 测 ， 即 施加 一 定 的 扰动 后 ， 明 测 随 时 间 变 换 的 响应 。 这 种 扰动 基 
施 吉 在 处 于 平衡 或 准 平衡 状态 的 电化 学 池上 。 施 加 的 扰动 一 般 是 电 扰动 (电流 ， 电 位, ш 
荷 )， 但 亦 可 能 施加 电磁 波 扰动 〈 如 光量 子 )， 观 测 的 响应 参量 往往 也 是 这 些 参 量 。 施 加 的 扰 
动 与 响应 之 间 的 关系 ， 称 为 系统 的 转移 函数 。 在 动力 学 研究 中 ， 对 施加 的 脉冲 振动 得 到 的 暂 
态 响 应 ， 需 要 在 27-3 个 数量 级 的 时 域内 ， 采 用 107-20 种 不 同 种 选 定 的 扰动 便 如 不 同 起 始 
一 最 终 电位 阶 腾 )。 如 需要 得 到 晨 域 的 响应 ， 常 规 作 法 是 变换 de 电位 进行 正弦 ac WES 
(记录 ac IRB), 这 样 的 试验 侍 少 要 用 10 一 15 种 不 同 输 入 频率 以 得 到 2—3 个 数量 级 范围 内 的 
量 测 响应 谱 。 这 种 类 型 的 试验 比较 费时 ， 所 以 一 般 只 用 作 基 础 性 理论 研究 。 常 规 化 学 分 析 测 
试 中 , 只 量 测 单 一 频率 ( 基 频 和 第 二 谐 波 交 流 极 谱 》， 单 一 时 间 《 脉 冲 极 谱 在 汞 滴 最 终 时 刻 作 
AME) 或 某 种 时 间 积分 响 成 〈 直 流 极 谱 平均 电流 及 计时 库仑 法 ),， 在 作 例 行 测试 时 亦 
不 考虑 电位 -电流 曲线 的 细节 ， 只 在 某 个 单一 电位 《〈 峰 电位 ) 进行 量 测 ， 或 在 响应 值 不 依赖 于 
电位 的 电位 区 间 内 进行 量 测 。 用 РЕТ 技术 可 完全 改变 这 -状态 。 在 电化 学 分 析 中 ,例如 微分 
脉冲 极 谱 分 析 ， 可 逆 的 扩散 控制 电化 学 响应 通常 最 适合 于 用 作 分 析 测试 ， 但 在 分 析 实 践 中 可 
能 出 现 一 系列 问题 。 例 如 , 系列 偏离 扩散 控制 过 程 将 影响 分 析 结 果 的 重 现 性 试 液 背景 干扰 ， 
如 表面 活性 物 存在 ， 电 极 表面 氧化 剂 存 在 等 ， 均 影响 电极 表面 状态 ， 甚 至 对 固体 电极 表面 作 
预 处 理 亦 不 能 解决 问题 。 如 能 在 分 析 过 程 中 随时 监控 这 些 动力 学 变化 因素 ， 发 现 异常 即 采取 
措施 ， 可 减少 其 对 分 析 结 果 的 影响 。FFT 导 纳 响 应 谱 测定 即 能 提供 这 种 信息 ， 可 编制 程序 从 
这 种 导 纳 赠 中 提取 有 关 电 极 过 程 动力 学 机 理 的 信息 ， 并 采取 相应 对 策 进行 必要 的 补偿 ， 或 至 
少 提出 有 关 问 题 的 警告 信息 。 

进行 FFT 电化 学 量 测 只 需 有 标准 的 模拟 式 电 化 学 仪器 ， 通 壕 模 数 转换 与 微机 接口 。 
FFT 计算 本 身 是 在 微机 上 完成 的 ， 某 些 新 型 电 分 析 技术 ， 如 半 积 分 与 半 微 分 伏 安 法 ， 如 果 用 
FET 将 使 仪器 设计 及 数据 处 理 大 为 简化 。 

值得 提出 的 是 ，FFT 在 MATLAB 上 已 有 专门 的 指令 ， 只 需 书写 一 条 指令 : 

a—tly) 
即 可 得 出 结果 ， 从 而 使 其 用 于 分析 信号 处 理 变 得 极为 简单 。 
(ED. 传 里 叶 变换 用 于 分 析 信 和 号 的 平滑 
由 于 傅 里 叶 变 换 可 将 时 域 或 空间 域 的 信号 转换 为 频 域 信号 ， 所 以 它 可 用 于 分 析 信 号 的 平 
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FUE, RBT ABS PROSE AE, KHER RN, HDE — 
Shu EAM elk, EARS RR. MMES — ЕЕ RN AS 
fm. BEL, ТЕМ SMUT ASS a AT a IEEE ИГ EE A НН 
БЕШИ И F 0468832 MEDEPTEASES ну. А ИЯЛ Я, ВАК 
冶 记录 0. O5pg + g Са TE O-Hg 火焰 中 测 得 的 422. 67nm 发 射 光谱 [图 5-6, (а) J, 图 (b) 是 
用 傅 里 叶 变 换 得 到 的 实 部 ， 这 曲线 的 右 部 是 高 频 信号 ， 主 要 来 白 误 差 的 贡献 。 如 用 一 截断 函 
数 图 (ec)，( 即 低频 部 分 为 1， 高 频 部 分 为 0). 截断 高 频 部 分 后 得 (a)， 继 对 (D PEAR Bat ie 
变换 ， 即 得 平滑 后 的 谱 图 (е). 


е bo 
| 


"E - — 


图 5-6 FT 用 于 发 射 光 谱 平滑 处 理 ” 
(a) Ca 的 原始 发 射 光 谱 ; (b) 为 GO 的 FT 变换 实 部 ; 
fo) 平滑 函数 ，(d) 滤 除 噪 声 后 的 得 里 叶 图 谱 
(e) 道 变换 后 还 原 得 平滑 后 的 光谱 
当然 ， 截 断 函 数 的 选取 ， 即 正确 定义 高 频 与 低频 是 平滑 结果 好 坏 的 关键 ,一般 可 根据 实 
际 信号 的 情况 加 以 选择 。 
(ж) 傅 里 时 变换 用 于 卷 积 与 解 卷 积 的 运算 
卷 积 与 解 卷 积 运算 在 电 分 析 化 学 中 有 重要 应 用 。Oldman"** “的 半 积分 伏 安 法 等 价 于 求 量 
测 的 电流 多 与 2 函数 的 卷 积 , 故 文献 中 有 关 方 法 有 时 称 为 卷 积 伏 安 法 。 卷 积 伏 安 法 的 导 纳 测 
定 均 是 电化 学 数据 处 理 中 应 用 FFT 成 功 的 实例 。 
傅 里 叶 变换 用 于 卷 积 的 解 卷 积 运算 主要 基于 以 下 的 卷 积 定 埋 
fla) КАФЕ). HOD (5-72) 
这 里 FGOS НОУТ / GO 53 h(z) 8848 B ER, 
н 1 G- 72238 Ж, PY ALD TEH 8 p BE i B CHE /(z) 与 变 宽 函 数 KKz) 算 出 变 宽 的 波 
KERER) 


FaF) 
FT 
А) HG) 
HGOFG)—GG) 
GG0— (C) 
RZ. Е) = СОНС) , 继 对 下 (zw) 进行 传 里 叶 道 变换 就 可 得 /x》, 即 解 卷 积 方法 可 出 测 
得 的 ( 变 宽 的 ) 光 谱 z (x) 与 变 宽 函 数 GO ,还 原 出 原始 波谱 CO ORE PUERO 
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FT 
g8(r)——Güu) 


Aw 


"HOD 
бш) 
Hü 
Рау) 
这 种 算法 亦 称 送 滤波 (inverse filtering) , i UG ВЕ T RE I ВАЗА, SEI GOD 
狭 名 宽度 影响 外 ,还 包括 了 量 测 误差 (噪声 )z(z) 
gG) FU XA THe) 


Fla 
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图 5-7 去 卷 积 运算 用 于 分 辩 重 查分 析 信号 
虚线 妖 - 测 得 的 妖 ; 实 线 峰 一 去 着 积 复原 的 峰 : 
靠近 横 轴 的 虚线 一 复原 妖 形 与 真实 峰 形 之 差 : 
西数 与 信号 半 宽 比 :60 (01.295 001.0 


考虑 到 信里 时 变 换 的 加 合 性 ,gCz) 的 变换 (wD) 为 
G@)=F@HW)+N@) 


Clo) _ Nw 
Ни Hoo 
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NG) 

HG) 

FGOT& JR MUR IGUG ЖОН PESE 83 AGO ME 48 EB PE IER LI Fo 是 其 估计 值 ,实际 运用 卷 积 定 
理 处 理 分 析 信 号 时 ,应 考虑 误差。 

TEBCE TRIS P О З ЖК PP Je Jo USE ЗЕ ОЙ GO ,一般 可 皮 一 很 窗 的 波谱 线 ( 至 多 为 
AGOBI 1/10 宽 ), 遂 过 实验 ,确定 4(z) 冰 数 。 此 算法 可 用 于 对 两 个 部 分 重 秋 峰 的 处 理 ,还 原 出 
的 原始 峰 形 分 辨 人 情况 较 变 宽 后 记录 的 谱 疼 有 显著 改善 ,这 是 一 种 有 用 的 重合 波谱 分 辨 技术 (图 
5-7), 


FQO=FW)+ 


、 小 波 变 换 用 于 分 析 信号 处 理 


如 前 一 小 节 所 述 , 传 里 叶 变 找 的 本 质 在 于 它 通过 三角 函数 将 时 域 信 号 变换 成 频 域 信号 ,从 
而 得 到 一 系列 看 用 信息 ,在 平滑 ,波谱 多 重 性 效益 及 波谱 量 测 方面 得 到 了 极其 广泛 的 应 用 。 然 
而 , 伟 里 叶 变 换 也 因为 这 一 点 而 使 其 同样 具有 自己 的 局 限 性 。 正 如 著名 数学 家 Meyer 指出 的 
那样 ,“ 当 你 记录 了 一 小 时 信号 ,如 果 在 最 后 五 分 钟 出 现 了 一 些 错 误 ,可 这 些 错误 就 将 殊 及 整个 
伟 里 叶 变 换 谱 ,” 因 为 传 里 叶 变 换 旨 在 将 整个 时 域 信号 变换 为 频 域 信号 ,而 失去 了 时 域 中 的 分 
办 率 。 为 此 出 现 了 窗口 傅 里 叶 变 撞 (Windowed Fourier Transform, WED) at A84 f8 Нр Ж 
(Short Tim Fourier Transform,STFT); 


WET ef) = |” ва rye nhi (5-73) 


其 物理 意义 如 图 5-8 所 示 。 从 图 5-8 可 见 ,虽然 傅 里 叶 变 换 ( 谱 ) 不 能 明显 表示 频 域 分 量 的 时 间 
局 域 化 ,但 这 样 一 种 局 域 化 可 通过 对 信号 =(:) 适 当 预 加 窗 得 到 。 窗 口 信里 时 变换 可 视 为 一 局 
部 谱 。 也 就 是 说 ,信号 zt) 在 时 间 的 窗口 傅 里 叶 变 换 就 是 信号 z(D) 弱 上 一 个 以 z 为 中 心 的 
“分 析 窗 六 (: 一 /所 作 的 侍 里 叶 变 换 。xz(t) 称 为 基 信 号 ,由 于 莱 上 一 个 相当 短 的 窗口 pG), 
等 价 于 取出 信号 在 分 析 点 :一 # 附近 的 一 个 切片 。 所 以 ,窗口 传 里 叶 变 换 直 接 是 信号 xz(z) 在 “分 
析 时 间 ” 附 近 的 “局 部 谱 ”。 


h(a’) 


z(t’) 


图 5-8 窗口 傅 里 叶 变换 示意 图 
然而 ,尽管 采用 了 窗口 傅 里 叶 变 换 可 解决 一 些 问题 ,但 仍 不 是 一 种 十 分 令 人 满意 的 方法 。 
内 窗口 您 小 时 ,得 到 时 域 突 变 信号 (如 尖峰 或 非 连续 信和 号) 的 能 力 愈 强 , 企 却 对 该 区 的 低频 信号 
无 法 反应 ;反之 ,窗口 太 大 时 ,突变 或 非 连续 点 信号 就 会 对 整个 窗口 的 传 里 叶 变换 谱 产生 影响 。 
图 5-9 就 示 出 了 一 个 这 样 的 例子 。 这 说 明 , 寻 求 一 个 全 新 的 信号 处 理 方法 看 来 是 很 有 必 
要 的 。 


©) 
5-9 不 同 宽度 的 窗口 傅 里 叶 变 换 与 小 波 变换 结果 的 比较 
(a) BEAT SBE at АЕН STR A RBM Cb) П Fourier 变换 的 结果 ( 左 窗口 宽度 太 大 时 .在 频 域 方向 的 
е а а 向 仍 匹 法 分 辩 ， 
右 一 窗口 XU A AN TERBOR on ИЛ RA HR IR E ШӘЛ EIL DS s Co NE НЕ А OEI ТЕЙ ЛУ 向 的 分 辨 
结果 可 以 接受 ,时 域 方向 的 分 辩 结 果 很 好 》 


小 波 变 换 就 是 这 样 一 种 全 新 信号 处 理 的 工具 ,可 以 说 是 近年 来 在 应 用 数学 领域 中 独 具 鬼 
力 的 成 果 。 小 波 变换 的 概念 最 早 是 由 法 国 地 球 物 理学 家 Morlet 于 20 世纪 80 年 代 初 作为 一 种 
信号 分 析 的 数学 工具 而 提出 ,很 快 就 引起 应 用 数学 界 的 高 度 关注 ,并 迅速 在 信号 和 图 像 分 析 、 
地 球 物理 信号 分 析 , 计 算 机 视觉 与 编码 \ 语 言 的 合成 与 分 析 , 信 号 的 奇异 性 检测 与 谱 估 计 . 甚 至 
在 分 形 与 混沌 理论 中 都 获得 广泛 的 应 用 [1。 在 小 波 变换 中 ,人 们 以 不 同 Bà" js BE" scaling) #0 
* A Bt ҖЕ” (resolution ) [s] BË fe i d Ca Ze ED ЯП Ж h 5, LELILIELLI 
(muliresolutiom) 或 多 标 度 的 方法 是 小 波 变 换 的 基本 点 ,其 目的 就 在 子 * 既 要 看 到 森林 (信号 的 
概 狐 ), 又 要 看 到 树木 (信号 的 细节 )。” 

小 波 变换 最 早 由 Bos 等 引 人 分 析 化 学 …*"?。 主 要 用 于 估计 流动 注射 分 析 峰 之 强度 及 处 理 
红外 光谱 数据 。 近 几 年 来 ,此 法 在 化 学 计量 学 界 已 引起 广泛 的 关注 ,有 关 小 波 应 用 的 文献 到 年 
增多 [ml ,在 我 国有 关 小 波 变 换 在 分 析 化 学 中 的 应 用 研究 也 得 到 了 相当 类 的 发 展 ”” 本 小 节 
将 在 介绍 基本 概念 和 算法 的 基础 上 ,对 小 波 变换 在 分 析 化 学 中 应 用 的 太 个 方面 给 出 必要 讨论 。 
小 波 变换 的 基本 定义 为 


Loi apt?) . 
WT,(a,b) = =l Al — |2008 (5-74) 


从 式 (5-74) 可 以 看 出 , 它 与 窗口 博 里 时 变换 [ 式 (5-73)] 很 相似 ,不同 之 点 只 在 子 小 波 变换 
少 了 三 角 函 数 变换 (CD) 一 项 ,但 增加 了 -个 伸缩 参数 <， 对 于 大 的 伸缩 参数 "， 基 函数 变 
成 展 宽 的 原 像 小 波 ， 是 一 个 低频 函数 ; 而 对 于 小 的 ， 基 天 数 则 成 为 缩小 的 小 波 ， 它 是 一 个 短 
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AOE. IE GC Bi. BUR AAS AH (multiresolution) 的 性 质 。 小 波 变换 
的 另 一 参数 为 平移 参数 5。 这 就 使 它 也 同样 具有 前 述 窗 口 傅 里 叶 变换 可 得 到 时 域 〈 或 空间 域 ) 
“局 部 谱 ” 的 特性 。 

Babs 小波 变换 不 像 情 里 叶 变 换 只 采用 三 角 函 数 为 其 基底 明 数 ,其 基 函 数 hA(，) 是 可 改 
ABT FLET UL AAI SE. AR AC) 对 应 于 不 同 的 小 波 变 措 , 最 著名 和 常用 的 小 
波 基 函 数 有 Haar 基 ，Daubechies 基 和 Coiflet 基 和 B- FE Ak AE A9. 止 是 因为 有 了 这 样 一 些 特点 ， 
使 小 波 变换 成 为 了 一 种 比 傅 里 叶 变 化 更 灵活 和 更 多 样 化 的 信号 处 理 的 数学 新 工具 。 

(一 ) 离散 小 波 变换 

在 分 析 信 号 的 小 波 变换 处 理 中 ,一 般 使 用 的 是 离散 小 波 变 换 (discrete wavelet transform) , 
如 将 前 述 小 波 变换 定义 式 中 的 小 波 基 函 数 单独 列 山 ， 则 有 有 : 


host) Ca! DAL GB) a] (5-75) 
继 将 其 平移 (translation) 和 伸缩 或 尺度 (scaling) 参 数 离散 化 , 即 
а=а b= Rabb, (hj HEBD) 
可 得 
WTG) = ac hla и. озодй (5-76) 


特别 有 实用 意义 的 是 二 2 40 06,1 时 的 小 波 函 数 ,使 得 
haa D= 27 70077 k) 
AP, jk MERER. 
ER j 是 可 由 负 无 穷 到 正 无 穷 的 整数 , 故 式 (5.76? 如 写成 
hast) — 27h QE (5-77) 
其 意义 是 完全 没 变 的 。 
如 果 有 -- 离 散 信 号 rü )=xrG= l, ,在 不 同 的 7 下 ,其 离散 小 波 变 换 也 就 相当 于 


WT,.G,À) = 27771, — Юл, 
= 


= сун и, — A) (5-78) 
о, +, ERAB CERERE k kina NEER Н Ч TE ЗЕ E THE 
变换 ;不 同 的 Л КЕНЕА RB RU YEAR OF ED TAL PECIA INIRE A 
要 求 相互 正 交 , 即 
(ua Phan) =д„дь 
Cro tB IE SCR PEL ,定义 为 
(ery? = [шуш (5-792) 


Gy) = Er dyG (5-79b) 
而 8 为 Kronecker BAX B 2, — 1j m) B 9, —0 Fem) ЗНА, А [B] je NICA BB BE 
正 交 的 ,如果 采用 不 同 的 分 辩 率 的 时 空 局 域 ,可 组 成 一 组 正 交 基 ,对 任意 信号 进行 小 波 变换 ,就 
相当 于 对 该 信号 不 同 分 辩 率 的 时 《 空 ) 局 域 进行 投影 ,可 得 到 不 同 分 辩 率 的 时 ( 空 ) 局 域 的 变换 
结果 ,这 正 是 小 波 变换 的 特殊 之 处 。 图 5-10 给 出 了 不 同 ;, F BJ Daubechies 小 波 之 例子 ,从 图 
5-10 可 以 看 出 ,小 波 函 数 正 是 通过 不 同 的 j, 来 调节 不 同 的 局 部 时 域 和 不 同 分 辨 率 的 。 
( 多 分 半分 析 
如 前 所 述 小 波 变 换 的 最 显著 特性 就 是 它 的 多 分 辨 特点。 用 多 分 辩 函 数 来 远近 任 一 画 数 的 
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基本 概念 是 由 Meyer 和 Mallat 38 Н 80599, k 1 TE ЕЖ Е TE RE 
ЖЕГЕ n0 15490, UE A SEA CAH ‚ШЖ ERABE AE PRT BH 
Tx B manis RUE EARL AE HL MESIA EER Ek BA PE Ж 
POI. PERTH RBE- ЖЭН НГЕ a SH, 

Cv Cv a Cu CuCl (5-80) 
BL 表示 平方 可 积 的 实数 空间 。 


一 


a d) 
图 $-10 “不 同 局 部 时 域 和 分 辨 率 的 Daubechies 小 波 
Ca) 不 同 局 部 时 域 的 Daubechies 小 波 CERO 
(b) ЖЕЙДЕ Daubechies 小 波 (FUE 
这 暗示 
u- <= {0} ee = L? 
由 式 (5-60) 的 上 述 空间 的 定义 ， 上 述 空间 自然 需 满足 下 述 尺 度 条 件 


hG) € veh (D € o. (5-81) 
MARGATE MMAR [278 (2170 ].. MEA 
AG) = Xue V 25-6 (5-82) 


xk (5-82) BAT, h(t) (构成 w REE RR) 就 是 由 及 24 一 如 GR, v, ВО HERE EURO. 的 
Ree AR. ERE AGO 称 为 尺度 函数 (scaling function) 或 尺度 滤波 (scaling filter), 尺度 
向 量 (scaling vector), a 则 称 为 尺度 函数 系数 。 另外， 在 多 分 辨 分 析 中 ， 为 表示 不 同 尺度 空 
间 中 的 区 别 ， 还 定义 了 另 一 类 小 波 函 数 фә G), 并 且 还 要 求 它 与 同 尺度 的 尺度 函数 正 交 ， 即 

< фо) >= (КҮ En (5-83) 


RP, Ly j 大 都 是 整数 。 
因为 сис CL, Д, ГЭВ ЙЯ ЛУКА ЖОКИ ЕВ], w G=0) 


ъ= Өч» (5-84) 
式 中 ， 包 表示 正 交 补 (参见 第 十 一 章 》 根据 (5-83) у (5-84) 两 式 , 还 有 
v, шн == ш, (5-85) 


L =v =v Pw pw dup (5-86) 
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E, WRT (5-86) REX 
p= Dib, VIRD (5-8) 
xh. b 称 为 小 波 系数 。 
图 5-11 给 出 了 尺度 咱 数 与 小 波 矢 其 空间 
"> 的 关系 . 
oS 下 面 以 Haar 小 波 为 例 来 具体 说 明 小 波多 
oo 分 辩 分 析 中 各 类 空间 的 具体 组 成 ， 


CD 首先 ，Haar DER AE RR ЖО 
jl 0<<1 


肯 根 据 


wi we l wol vo wD wD 


i Ds TRA) 
图 5-11 尺度 函数 与 小 波 函数 空间 关系 示意 图 v — 
及 0) — hv 280r D 


可 组 成 不 同 的 尺度 函数 与 小 波 函 数 空间 . 在 此 , 需 指出 的 是 ， 对 于 Haar Л, GU HE ЯС 
Жа, 只 需 取 两 个 : 二 1/ V2; a 一 1/ V2 ; DAKAR RERAN: 91/2. 
b=-—1// 2 。 所 以 , 如 定义 上 面 给 出 的 Haar 小 波 尺 度 函 数组 成 的 是 we 空间 的 话 ， WJ o, 空间 
的 尺度 函数 叮 由 


AG а VZ h (2) Бау MDAC 1) 
=(1/ 42) / 2 WODHA / 2) V 2 (OL71) 
= hy (21) hg (2t—-1) 


pn 001/2 
=- 其 他 
TEE PK a 
Oe STA = V TAOISD 
= hg(2t)— А022 —1) 
1 о<и<1/2 
4 1/2«tl 
0 其 他 


由 此 类 推 ， 可 求 出 vs z, 各 空间 的 Haar 小 波 的 尺度 基 函 数 和 小 波 基 郴 数 。Haar 小 波 基 
的 mm 与 w SABE BRR w 与 wi 的 空间 天国 数 图 像 示 于 图 5-12。 

(Z) 多 分 辨 信 呈 分 解 算法 

前 面 两 小 节 给 出 了 小 波 变换 中 最 重要 的 基本 概念 ， 但 实际 上 ,小波 变换 的 应 用 都 是 通过 
Mallat 提出 的 多 分 辨 信号 分 解 (Multiresolution Signal Decomposition, MRSD) 或 塔 式 
(pyramid) 算法 来 实现 的 , 其 算法 在 小 波 变 换 中 的 地 位 就 与 快速 依 里 叶 变 换 (FFT) 在 传 里 叶 
变换 中 的 地 位 一 样 重要 。 

如 果 量 测 所 得 的 离散 分 析 信 号 可 由 ce 二 fcf?,c9,…,cW] 来 表示 ,其 中 上 标 (0) 表 示 是 分 
辨 为 零 , 即 未 进行 任何 小 波 变换 的 原始 数据 ;N 为 其 测 点 数 ,为 不 失 一 二 性 ,可 假设 NN 一 2*， 


(为 正 整数 ), 则 


" " e M 
cG) = e Ra » Мат eua 
mA 


， T 
a Mere керю 1 № Мае QD 
as 


др. SOROR R Lee N) K 
TERNERA: G=) ОЭ 
未 在 /水平 分辨 率 下 的 小 波 变换 的 尺度 函 
数 和 小 波 函 数 的 系数 ;4,8: 则 是 对 应 的 尺 
Je k eH A ANE PK. 

可 以 证 明 ,对 于 不 同 分 辩 水 平 的 尺度 
函数 系数 co MS XII qu EE 
归 式 (5-89) 算 出 C9: 

=T св 09-888) 
а= ST Уот (S-89b) 
式 中 ,gi 与 z, 分 别 表示 低 通 滤波 器 和 (一 
{qr}) 和 高 通 滤波 器 GC = (z, DE МОР рл. 
索 , 它 们 应 只 有 如 下 性 质 ， 
gm Cg (5-90) 
mH 


' 


co 


гү —— 
г 
— Ssi 
——— FT L 

子 空间 vy (a) 


也 一 
一 一 一 
—1;— 


TEH w, TEN w, 


(b) 


Wa Haar COE TT CT EI 


>a = SEs 80 
上 述 这 两 种 系数 中 , a 是 主要 的 ,只 要 Q 确定 了 ,gi 也 就 唯一 确定 了 。 NL 的 取 法 有 
多 种 多 样 ， 不 同 的 小 波 基 函数 就 有 不 同 的 go 最 简单 的 就 要 算 Haar “RS. 


1 


1 
三 -= 
ШЕЕ " м 2 


въ (1) o 一 4, 一 


2 一 (一 1) 9 i= 


<5-91а) 

1 = 
Va 《5 91b) 
a-— y 《35-91c) 


КЕЛ ЕЕН 利用 前 述 递归 式 即 可 算出 所 有 各 个 分 辩 素 下 的 尺度 函数 和 小 波 函数 的 系数 а? 
ж di ж. 小 波多 分 辨 信号 分 解 也 就 逐步 进行 了 。 所 以 , 如 何 得 到 不 同 的 小 波 变换 的 a 是 小 
波多 分 辩 信 号 分 解 的 关键 所 在 。 有 关 如 何 确定 9 的 方法 ， 读者 可 参阅 文献 [39] 及 文献 [25] 。 

下 面 给 出 多 分 辨 信号 分 解 “MRSD》〉 的 具体 矩阵 算法 : 

(D 低 通 滤波 矩阵 Q ЕЕЕ ЕЕ G 的 构造 

不 同 的 小 波 函 数 《 如 Haar 小 波 ，Daubechies 小 波 ，Coiflet 小 波 等 ) BRAN а. ШАН 
一 小 波 函 数 还 有 不 同 长 度 工 (LH, s 0, 1, s. L). 如 Dauhechies 小 波 就 有 长 度 为 2， 
4，6，8， 心 等 多 种 尺度 函数 的 系数 供 选 择 ， BRET KE ЖӨЕ КЖЕ Q EM 
Gu 


Qa (5-92a) 
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G,—8, o (5-92b) 
XD) L=2 ‹Р,..=р,), MFRS TEED 16 的 Q BEAL G 阵 的 构造 为 例 来 名 以 具体 说 明 。 
DHX (5-92) 可 以 看 出 全 阵 和 G 均 为 (8*16) MERE, MATS 


于 是 

Г@-\ Qo т Ф 0 0 ... E 01 
0 0 G1 € qm h | 
0 0 0 qa 9 q i 
0 0 0 0 0 qa q@ a 9 0 

i i i i i i H Poi: d E ; 7 

r-[2)-- Q « O0 OQ vo -— 0 $44 4 ap 

G B-1 Bo B & 0 0 ... EP a 0 
0 0 ga g & m 0 0 
0 0 0 0 gy & д д: 0 0 0 
0 0 0 0 0 0 Fi m n ge 9 
L & 0 0 Q + ө 0 £g. £j 


在 构造 式 (5-93) 这 一 矩阵 时 ， 如果 О =g- G—20 Ast o. FE k MER 
都 置 为 0， 对 于 本 例 因为 所 取 长 度 为 2， 故 只 有 9-:，9，9， o BR. M442 或 < 一 
at, OSS, 另外 , CONG ЕВЕ 01, Mis. j=l, 2]. Q,—a 5749. 8 
а-а о o gos qu qi 的 范畴 ， 应 取 为 零 ， 但 矩阵 《5-93) 0809 91, 9 E д, EE 
为 了 保持 矩阵 QQ@ 和 的 正 交 性 ， 属 于 特例 。 实 因 


rr-[2] [e G] =I (5-94) 


Q Ë GER HE CET (818 MRSD 唯一 。 
(2) 信号 逐步 分 解 
逐步 分 解 以 得 到 不 同 分 辩 率 及 不 同 长 度 的 分 解 信号 矢量 
& —Qo 
中 一 Ge 
e= Qc, = 
4,= бус, =6,00 


6,=9,-1° 2:06 

4,726, 8,00, 
这 一 分 解 过 程 可 由 图 5-13 形象 表 出 。 
从 上 述说 明 可 以 看 出 ,每 经 过 一 次 分 解 ， 原 信号 的 分 解 水 平 增加 1， 而 信号 矢量 的 长 度 减 半 ， 
所 以 一 般 要 求 原 信号 矢量 的 长 度 为 N=2+， 当 信号 矢量 的 长 度 不 等 于 2^ 时 ,或 丢弃 两 头 信息 
量 含量 相对 小 的 量 测 点 ， 或 增补 一 些 量 测 点 来 满足 这 一 要 求 。 另 外 注意 到 ， 将 马 矩 阵 称 为 低 
BE, G BA REER, 所 以 一 般 说 由 О 阵 投影 所 得 的 ec” 一般 包 含 着 原 信号 的 
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低频 信息 ， 而 由 G 阵 投影 得 到 的 а? 一般 包 含 原 信 号 


的 一 些 高 颖 细节 .值得 指出 的 是 ,Q, TIRAGE ，， =] 
阵 缩小 一半， 但 构成 原则 仍 同 全 阵 。 wb o 
(3) 信号 的 逐步 复原 U cv» ][ pe 
AAE =E =G'， 所 以 得 到 的 多 分 辩 信号 分 *”! wil 
解 矢量 可 很 容易 还 原 。 即 px 

0 Dy 7996 dli IE - 
M 


e- = 0, "0,00 
Gd = GG, Q Qc, — — 
d,-1=6, -10 Qc an [e^] [e] 
BQ AG 就 等 于 Q* 和 G'， 这 就 为 分 解 信号 的 
复原 带 来 很 大 的 方 使 。 以 后 可 以 看 到 就 是 利用 这 一 特 
性 ， 小 波 变换 亦 具有 很 强 的 去 噪 功能 。 
(四) 几 个 常用 小 波 基 尺 度 函 数 与 小 波 函 数 系数 表 
如 前 所 述 ， 对 于 不 同 的 小 波 基 ， 都 有 不 同 的 2 和 z (m — Ll. s O, е, L), Wi 
些 尺 应 函数 和 小 波 函 数 的 系数 是 构成 多 分 辨 信号 分 解 算法 之 关键 。 为 方便 读者 , 表 5-10 GR 
5-11 为 最 常用 的 3 个 小 波 基 即 Haar 小 波 ，Daubechies 小 波 和 Coiflet 公 波 函数 的 系数 表 。 


Җ 5-10 Daubechies 尺度 及 小 波 函 数 系 数 表 


图 5-13 多 分 辨 信号 分 解 算法 
( 塔 式 算法 ) 示意 图 


Daubechies (L— 4) Daubechies (1.=3) 
—— ,..ÑN. 
Ë а а k а ғ 
一 3 0. 23037 781330890 0. 01059741078507 -2 0. 33267055795008 | —0.03522629188571 
2 ©. 71484657055292 0. 03238301166689 一 1 0. 80689150931103 | — 0. 08544127388203 
-1 0. 63088076792986 0. 03084138183555 
o | _0.02798376941686 | —0. 18703481171909 0 9. 45987750211843 0. 13501102001025 
1 | —0.18703481171908 | —0. 02798376941686 1 | --0.13501102001025 0. 45987750211849 
2 | —0.03084138183556 | —0. 63088076792986 2 | —o.o8544127388203 | —o. 80689150931109 
з | 0.03288301168589 | —0. 71484657055292 
4 | —0. 01509740178507 | —0. 23037781330890 3 | 0 03522629188571 0. 38267055295008 
Daubechies (L2) Daubechies (L251) (at Haar) 
* Ф & k Ф E 
一 1 0. 48292691314453 0. 12940952255126 
ü 0 5 ^ 0678118655 
0. 83651630373781 0. 22414386804201 ? 9: 70710678118655 9. 707100781 
1 0. 22414386804201 0. 8651630373781 0678 о, 7071067811865 
2 2940952255126 0. 48292691314453 1 0. 7071 118655 dl 5 
表 5-11 Сопи 尺度 及 小 波 函 数 系数 表 
Coiflet (L= 3) Coiflet (L=4) 
Ë а а k E а 
一 2 | —0 07273261951285 0. 01565572813546 =3 0. 046875000000C0 | — 0. 01565572813546 
. 一 2 | 一 0.02116013576461 | —0.07273261951285 
S1 | 9 3978976824578] 0.07273261951285 一 1 ; 一 0. 140625000000C0 | —0- 38486484686420 
° 0.85257202021226 | 一 0. 38486484686420 o 0.43848040729385 0. 38486484686420 
1 0. 38486484686420 0. 85257202021226 H 0. 38486484686420 0. 43848040729385 
_ 285 | —0.33789766245781 2 0. 38486484686420 | —0. 14082500000000 
2 0% 07273261951 ' 3378976645 3 | —0.07273261951285 0. 02116013576461 
3 | 一 0.01565572813546 | 一 0. 07273261951285 " 0. 01565572813546 0. 04687500000000 
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Coiflet (L=6) 
" " n L " | P 
-5 小 16387336464 0.000720549446 | 1 —9.076488599078 | 0. 417005184423 
一 4 一 0 041464936781 —0.0о1823208870 | 2 0. 058424418646 0. 812723635449 
-3 — 0. 067372554722 —0. 05611434819 | з 9. 0236680171946 0. 388110066823 
-2 0. 386110066823 0. 0236680171946 | 4 0. 005611434819 0. 067372554722 
E 0. 812723635449 0. 059434418646 | 5 —.001823208870 —0. 041464936781 
0 0 417005184423 一 0.078488599078 | s —». 000720549446 —0. 16387336464 


(五 ) 分 析 信号 的 小 波 变换 处 理 

因为 小 波 变换 实际 上 是 一 种 比 傅 里 时 变换 更 有 力 的 信号 处 理工 具 ， 所 以 ， 近 年 来 ， 在 分 
析 化 学 中 得 到 了 非常 广泛 的 应用 ， 尤 其 是 近年 来 ， 应 用 面 越 来 越 广 ， 是 一 个 很 值得 引起 关注 
的 研究 领域 "9 ， 以 下 将 主要 介绍 几 种 已 取得 成 功 应 用 的 方法 。 

1. 小 波 变换 用 于 数据 压缩 

从 前 节 多 分 辨 信号 分 解 算法 (MRSD) 可 容易 看 出 , 每 经 过 一 次 变换 , 分析 信号 的 长 度 就 
被 压缩 一 半 , 经 过 几 次 变换 , 信号 就 串 以 2 的 指数 速率 往 下 降 , WA, 采用 逐步 复原 的 策略 ， 
R Q PERI G Fe, 又 可 很 容易 地 将 分 析 量 测 信号 复原 ,这 对 于 有 些 采 样 点 较 多 的 一 些 分 
析 信 号 ， 如 红外 光谱 ， 核 磁 共 振 谱 等 的 保存 ， 传 输 以 及 建立 较 大 量 测 波谱 数据 库 是 非常 有 好 
处 的 。 逐步 复原 过 程 就 是 一 个 简单 的 矩 阵 乘法 过 程 恢 复 速度 很 快 ， 所 以 这 一 压缩 技术 可 望 在 
分 析 化 学 中 ， 特 别 是 在 分 析 化 学 中 波谱 专家 系统 的 构建 中 取 到 非常 重要 的 作用 。 将 小 波 变 换 
用 于 紫外 光谱 压缩 就 是 一 个 很 成 功 的 例 于 5 。 

另外 ， 由 于 近年 来 联 用 仪器 的 发 展 相当 快 ， 往 往 一 个 样本 就 产生 190 万 个 数据 点 ， 这 就 
为 从 中 提取 信息 和 进行 运算 带 来 很 多 困难 ， 将 小 波 变换 的 压缩 功能 用 于 这 些 类 数据 的 解析 之 
L, 也 是 一 个 很 成 功 的 例子 *， 实 因 经 小 波 压缩 后 的 数据 ， 吕 得 主要 信息 ， 而 使 数据 量 成 倍 
减少 。 

2. 小 波 变换 用 于 分 析 信号 的 背景 扣除 

如 前 述 小 波 变 换 的 一 个 最 大 特点 就 是 靠 两 个 矩阵 即 低 通 滤波 矩阵 和 高 通 滤波 矩阵 G 对 
分 析 信号 进行 不 同 分 辨 率 的 投影 运算 ， 一 般 说 来 由 低 通 滤波 矩阵 投影 得 到 的 为 不 同 分 辩 率 的 
低频 信号 ， 而 高 通 滤波 和 矩阵 投影 得 到 的 为 不 同 分 辨 率 的 高 频 信 号 细节 ， 而 由 仪器 分 析 所 得 的 
分 析 量 测 信号 背景 漂移 一 般 可 由 最 低频 信号 给 出 ， 借 助 分 析 人 员 的 工作 经 验 ， 不 同 分 辨 率 所 
得 之 低频 信号 往往 可 很 好 地 将 背景 与 纯 信号 分 离 .文献 "将 此 技术 用 于 二 维 联 用 色谱 的 化 学 
秩 估计 间 题 ( 见 第 五 章 )。 将 此 法 用 于 极 谱 峰 的 背景 扣除 亦 是 一 个 很 好 的 例 于 "全 。 
3. 小 波 变 换 用 于 平滑 除 噪 
RM (或 平滑 ) 在 分 析 信号 处 理 中 是 一 个 相当 重要 的 任务 ,寻求 一 种 很 好 的 除 噪 方法 ， 一 
直 是 化 学 计量 学 值得 研究 的 问题 。 小 波多 分 辨 信号 分 解 算法 (MRSD) Яра ЯЗ РЧ, 它 
一 般 可 通过 对 高 通 滤波 矩阵 的 投影 信号 (或 称 小 波 域 wavelet domain) RAYE (Threshold) 的 
方法 来 进行 。 数学 家 们 在 小 波 分 析 的 这 一 领域 中 做 了 不 少 工作 ~ 沪 。 在 此 , 我 们 仅 给 出 一 例 
来 形象 说 明 小 波 变 换 如 何 利 用 取 阅 值 来 进行 除 噪 的 过 往 。 

图 5-14 给 出 的 是 一 个 用 小 波 来 对 核磁 共振 谱 进 行 除 噪 的 例子 。 

从 图 5-14 例 于 可 以 看 , 小 波 用 于 除 品 似 乎 与 依 里 叶 变 换 除 蝶 无 本 质 区 别 ， 都 是 去 掉 变 换 
谱 中 的 一 些 值 ， 情 里 时 变换 去 掉 的 是 高 频 部 分 。 然 而 两 者 除 品 的 原理 是 很 不 相同 的 ， 值 得 所 
出 的 是 小 波 变 换 除 噪 后 是 有 可 能 保存 高 频 信号 的 ， 用 于 高 频 信 号 除 曲 当 优 于 传 里 叶 变 换 。 


193 


69 200 | 
ар 
100r 
E: 
š хр ў 
| 人 一 一 
-20 , ~ 100 " 
0 500 1000 o 500 1000 
时 域 NOR 
fa) (b) 
200 60 
100 “or 
E E. 
š dp 20 
ЕУ на = 
oF “| 
- 100 | -20| 1 
6 500 1000 5 300 1000 
小 波 域 时 域 
(©) (a) 


图 5-14 小 波 变换 用 于 核磁 共振 谱 除 品 的 一 个 例 于 
(a) Base, O 小 波 变换 的 细节 矢量 ; 
(e) 去 掉 低 于 辣 值 以 下 元 素 的 细节 矢量 ! Qd) FORUM ESE a RON 


4. 小波 变换 在 分 析 化 学 其 他 方面 的 应 用 

实际 小 波 变换 还 可 用 于 其 他 方面 ， 如 图 像 处 理 “)， 因 小 波多 分 辩 分 析 可 容易 拓 广 至 二 
Ф. 具有 很 大 的 灵活 性 。 另 外 ,小 波多 分 辨 信号 分 解 MRSD)， 可 同时 给 出 信号 的 全 狐 〈 低 
通 部 分 ) 和 细节 (高 通 投影 部 分 )， 而 且 信 号 的 压缩 又 是 同时 进行 的 ， 所 以 可 以 预料 , 它 可 在 
模式 识别 的 特征 抽取 (参见 第 九 章 ) 中 得 到 广泛 而 有 趣 的 应 用 "1。 由 于 小 波 变 换 本 身 还 在 
不 断 发 展 ， 可 以 预计 ， 它 将 在 分 析 信 号 处 理 中 得 到 更 加 广泛 而 又 深入 的 应 用 。 
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第 六 章 ”多 元 校正 与 多 元 分 辨 


第 一 节 ”分析 化 学 中 的 校正 理论 
—. R. B. 灰 多 组 分 体系 分 类 


现代 分 析 化 学 作为 一 门 化 学 量 测 科学 ， 有 其 本 身 的 基本 特征 。 国 家 自然 科学 基金 委员 会 
组 织 的 学 科 发 展 战略 调研 报告 "中 指出 现代 分 析 化 学 学 科 在 当今 变革 中 具有 如 下 两 个 基本 
特点 ; © “从 采用 的 手段 看 ， 分 析 化 学 是 采用 光 、 电 、 矿 、 热 、 声 等 物理 现象 基础 上 进一步 采 
用 数学 、 计算 机 科学 及 生物 学 等 新 成 就 对 物质 作 全 面 的 纵深 分 析 的 科学 ”; @@“ 从 解决 的 任务 
看 .现代 分 析 化 学 已 发 展 成 为 获取 形形色色 物质 尽 可 能 多 和 尽 可 能 全 面 的 结构 与 成 分 信息 , 进 
一 步 认识 自然 疏 造 自然 的 科学 .” 简 言 之 ,分析 手 段 的 仪器 化 和 化 学 体系 的 复杂 化 已 成 为 现代 
分 析 化 学 学 科 的 两 大 重要 特征 。 

首先 考察 一 下 现代 分 析 化 学 的 仪器 化 这 一 基本 特征 。 近 几 十 年 来 ， 大量 新 型 仪器 〈 如 色 
谱 ， 光 谱 ， 波 谱 ， 极 谱 等 ) 相继 问世 ， 尽 管 其 具体 内 容 存在 多 种 差别 ， 可 都 是 为 分 析 化 学 家 
提供 一 个 谱 (多 变量 数据 ), 而 且 这 个 谱 包 含有 关 分 析 化 学 样本 的 定性 ( 含 结构 ) SEAS. 
用 数学 语言 说 ， 分 析 仪 器 提供 的 是 矢量 类 型 的 数据 。 随 着 分 析 仪器 的 不 断 进步 和 联 用 技术 的 
ЖШ. 有 些 仪器 还 可 产生 算 阵 或 张 量 ) 类 型 的 数据 信息 如 GC-MS, HPLC-DAD, GC-IR, 
CE-DAD. HPLC-MS, 缘 光 分 析 的 激发 发 射 光谱 ， 多 维 核磁 共振 谱 , E). 经 典 分 析 化 学 的 校 
正方 法 仅 以 单 点 数据 [标量 ] 为 基点 ， 如 光谱 以 最 大 吸收 点 ， 色 谱 以 面积 等 来 表征 仪 内 数据 ， 
这 样 势 必要 导 失 很 多 有 用 信息 ， 对 于 产生 矩阵 类 型 数据 的 仪器 ， 经 典 分 析 化 学 中 的 数据 处 理 
方法 则 更 是 无 能 为 力 了 。 这 就 向 分 析 化 学 工作 者 握 出 了 一 个 新 问题 ， 从 这 些 矢量 或 矩阵 形式 
的 数据 中 ,是否 能 抽取 出 比 单 点 数据 更 多 更 重要 的 化 学 信息 呢 ? 在 以 后 的 讨论 中 即将 看 到 , 近 
年 来 得 以 迅速 发 展 的 化 学 计量 学 对 此 给 出 了 肯定 的 回答 。 

另 一 方面 ,考察 一 下 在 分 析 化 学 家 的 研究 目标 -一 形形色色 的 分 析 试 样 的 重要 特征 
目前 。 由 于 生物 学 、 生 命 科学 药物 学 、 环 境 科学 等 学 科 的 迅猛 发 展 ， 对 分 析 化 学 亦 提 
出 了 较 高 要 求 ， 即 要 求 对 复杂 混合 物体 系 ， 例 如 复 杀 有 机 混合 物体 系 给 出 快速 定性 定量 
分 析 ， 正 是 这 一 要 求 ， 使 得 近年 来 色谱 分 析 得 到 飞速 发 展 。 可 以 这 样 认 为 ， 纯 品 的 分 析 
在 现代 分 析 化 学 已 不 构成 特殊 困难 ， 困 难 就 在 于 混合 物体 系 的 直 楼 快速 分 析 。 这 样 形 形 
色色 的 多 组 分 体系 是 否 也 存在 某 种 特征 ， 针 对 这 些 特征 分 析 化 学 家 是 否 有 相应 策略 与 之 
对 应 ? 

在 实际 分 析 工 作 中 ， 我 们 所 碰 到 的 混合 物体 系 ， 一 般 说 来 ， 不 外 平 以 下 三 种 情况 : 

(D 对 某 些 混合 体系 ,其 定性 组 成 均 已 知 ,分 析 目 的 只 在 于 对 各 种 物种 〔 或 物种 的 不 同形 
dO 或 部 分 物种 进行 定量 分 析 ， 这 样 的 试 样 包括 己 知 药物 片 剂 和 某 些 已 知 有 机 反应 的 过 程 分 
析 样 本 。 因 该 体系 的 定性 组 成 已 完全 清楚 ， 我 们 将 其 称 之 为 “白色 分 析 体系 ”， 在 以 后 的 讨论 
中 ， 可 以 看 到 ， 除 少数 非 线性 和 所 谓 “病态 体系 ”外 ， 分 析 化 学 计量 学 均 可 给 出 令 人 满意 的 
解析 结果 。 
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D ЛЕ Ж ИЕ B. 即 有 关 其 物种 数 , NES UAI E i EE 
不 清楚 ， 分 析 化 学 的 任务 是 首先 确定 其 物种 数 ， 进 而 解析 出 各 纯 物 种 的 谱 图 〈 可 以 是 光 
HRW. YO 即 先 将 其 首先 转化 成 为 白色 分 忻 体系 ， 然 后 进行 定量 分 析 。 这 类 分 析 体 
系 是 分 析 化 学 中 最 难 解析 的 … 类 体系 ， 因 其 像 个 黑 慎 子 ， 故 我 们 称 之 为 ”由 色 分 析 体 
R”. 分 析 化 学 计量 学 家 们 已 研究 出 了 不 少 基 十 扼 阵 数据 结构 和 张 基 数据 结构 的 化 学 计 
量 学 解析 方法 ， 亡 其 是 对 于 色 滴 联 用 仪器 ,如 GC-MS. TIPLC-DAD. GC-IR, CE DAD. 
HPLC-MS 所 产生 的 矩阵 数据 ;已 发 展 了 一 系列 解析 新 放 法 ,可 望 解 炽 黑 色 分 析 体 系 的 快 
速 定性 定量 分 析 和 问题 。 

S 除 以 上 讨论 的 “白色 ”与 “黑色 ”分 析 体 条 外， 还 有 一 类 样本 ， 其 基本 特征 为 已 知 
茶 些 待 测 物 种 存在 于 待 分 析 的 样本 . 但 是 各 存在 别 的 末 知 于 拢 却 不 清楚 ， 分 析 日 的 是 在 木 知 
干扰 的 存在 下 ， 直 接 对 感 兴趣 的 待 测 物种 进行 定 其 分 析 。 此 类 分 析 体系 可 以 说 是 分 析 化 学 家 
HORS -类 体系 ， 因 其 定性 组 成 只 部 分 已 知 , 介 乎 十 “白色 ”与 “肤色 ”分 析 体 系 之 间 
故 将 其 称 之 为 “项 色 ” 分 本 体系 。 对 于 这 类 分 析 体系 . 可 以 过 明 ， 只 要 可 获得 矩阵 类 型 的 数 
据 ， 一 般 涪 来 分 析 化 学 计量 学 方法 可 望 获得 有 物理 意义 的 唯一 解 。 

从 以 上 讨论 可 知 、 无 论 是 从 分 析 手 段 和 研究 对 象 来 看 ， 现 代 分 析 化 学 是 一 门 有 极其 丰富 
内 涵 的 化 学 量 测 科学 ， 分 析 科 学 家 面临 的 一 个 基础 性 课题 ， 是 研究 怎样 才能 更 合理 有 效 地 采 
用 已 有 的 多 种 化 学 量 测 手段 ， 以 达到 解决 不 同类 型 的 复杂 多 组 分 分 析 体系 的 定性 定量 解析 问 
题 的 目的 。 这 一 基础 课题 的 研究 ， 构 成 现代 分 析 化 学 基础 理论 研究 的 重要 组 成 部 分 。 


Hol 单 点 数据 与 矢量 数据 的 信息 差别 
Ф) a，6 一 分 别 表 东 两 种 化 学 物质 ， 因 它们 都 在 某 一 波长 存 企 吸 收 -如 GO Pra. KAER 
AMEE: а, РЕВА, ПАНК 
LUIS В ел А АЈА. ME CO Bra. 
这 为 它们 共存 时 的 办 析 提 供 了 有 用 信息 


经 典 分 析 化 学 的 校正 方法 的 基点 是 以 单 点 数据 (标量 ). 如 某 一 物理 和 化 学 的 信号 与 分 析 
体系 中 某 一 待 测 物质 存在 某 神 对 应 的 数量 关系 (一 般 为 线性 关系 ). 分 析 工 作者 就 可 借 此 对 该 
化 学 物质 进行 定性 定量 分 析 。 本 书 所 论 及 的 多 元 校正 和 多 元 分 辨 方法 与 上 述 经 典 校正 方法 在 
概念 上 已 有 了 本 质 区 别 ， 它 不 只 是 用 几 个 相应 测量 点 来 求解 的 传统 多 组 分 同时 测定 的 简单 扒 
广 ， 在 这 里 有 一 个 从 标量 校正 向 矢 基 、 矩 阵 ， 甚 至 是 张 量 数据 解析 的 概念 性 飞跃 。 由 子 矢量 
GER, KE MEERE ( 单 点 数据 ) 所 含 信息 要 多 ， 由 此 就 产生 了 很 多 新 的 分 析 方法 ， 
它们 可 解决 很 多 在 标量 分 析 中 被 认为 是 不 可 能 ， 甚 至 难以 想象 的 问题 ， 即 在 前 节 所 讨论 的 所 
亩 “灰色 ”与 “黑色 ”多 组 分 分 析 体 系 的 解析 问题 ， 为 分 析 荆 作者 开辟 了 一 个 崭新 的 研究 领 


197 


域 .图 6-1 RA HR EU CY, RRS uE E Ж #2} 
闪 方 法 的 关系 示 于 图 6-2。 如 果 采 用 张 量 数学 语言 可 以 把 标量 看 成 零 阶 张 基 ,矢量 看 成 一 阶 
Жж. 矩阵 和 三 维 数据 分 别 看 成 二 阶 和 三 阶 张 量 , 则 从 图 6-2 可 以 看 出 , 随 兰 分 析 体 系 的 复杂 
程度 逐渐 增高 ， 即 从 “白色 ”分 析 体 系 到 “黑鱼 ” 分 析 体系 ， 如 果 想 得 到 有 物理 意义 的 唯一 
解 ， 所 需 数据 的 阶 数 亦 应 提高 作 行 ， 同 时 也 告诉 我 们 、 随 着 能 产生 多 维 数据 的 新 分 析 仪 器 
(新 联 用 仪器 ) МИН, 分 析 化 学 家 们 解决 更 复 寻 分 析 体 系 的 能 力 亦 念 强 , 从 而 展现 了 现代 分 
HEN AHR. 


EDT! [Г] 


SMCRAR | 
| ITTFA eral 
| WSA HELP 
| SFA OPR 
wad 


IX 


一 阶 张 量 


数据 维 数 


FHKE- павя 


HN Heke Kenk BARE 
体系 复杂 性 一 一 一 


图 6-2 ”体系 复杂 性 与 所 需 仪 器 数据 维 数 的 关系 

MELR 一 多 元 线性 网 归 方法 ; KF 一 Kalman 滤波 法 ; WMLR— IU RC LE BUH E, K-M 一 天- 矩阵 法 ; P 
МОРЕ) PCR 一 主 成 分 回归 法 ; PLS 偏 最 小 二 乘法 ; GSAM 一 通用 标准 加 入 法 ; AITTFA 一 标准 加 人 
先 代 目标 转换 因子 分 析 法 ; AKF 一 自 适应 Kalman BMH: GRAFA 一 广义 秩 消 失 因 于 分 析 法 ; REL-RE E 
线性 分 解法 ; CRBI 一 约束 背景 双 线 性 分 解法 ，SMCR 一 白 模式 曲线 分 状 法 ，AR -交替 最 小 二 乘 回归 法 、 
ITTFA 一 过 代目 标 转换 因子 分 析 法 ;EFA 一 产 进 因子 分 析 法 ; WEA OW SSK, HELP ”直观 推导 式 
注 进 特征 投影 法 ;OPR 一 正 交 投影 分 辨 法 ，SFA-- 子 窗口 因子 分 析 法 ; PREA 投影 旋转 因子 分 析 法 

图 中 方 框 中 为 化 学 计量 学 近年 来 发 展 的 多 元 校正 与 分 状 方 法 , 实 线 方 框 内 的 方法 一 般 可 得 唯一 解 , 市 虚 
钱 方 杠 内 的 方法 除 特殊 情况 可 得 唯一 解 ， 一 般 给 出 的 为 一 定 条件 下 的 最 忧 解 。 


Z, KEREM 


在 此 介绍 的 校正 理论 主要 由 Lorber’) #l Kowalski 84 Ht: , mAAR A АННЕ 
学 第 二 层次 的 基础 理论 的 重要 组 成 部 分 外, 简 言 之 ,校正 理论 就 是 分 析 化 学 中 的 定量 分 析 
理论 ， 它 将 常用 的 经 典 分 析 化 举 中 的 灵敏 度 、 选 择 性 、 信 品 比 、 检 测 下 限 以 及 结果 可 千 
性 评价 等 已 为 广大 分 析 化 学 工作 者 广泛 接受 的 基本 概念 ， 拓 广 至 矢量 甚至 张 量 数据 ， 将 
为 分 析 工作 者 针对 不 同 分 析 体 系 ， 选 择 正确 定量 校正 方法 ， 评 价 分 析 结果 的 可 靠 性 提供 
理论 依据 ， 

表 6-1 给 出 了 该 理论 提出 的 基本 公式 , 在 此 , 只 对 这 些 公式 的 意义 加 以 适当 说 明 , 而 有 关 
矢量 校正 公式 的 详细 推导 ， 请 参阅 本 章 多 元 校正 的 分 析 化 学 品质 因数 和 可 靠 性 分 析 一 节 ， 还 
可 进一步 参阅 文献 [2,5~9]。 

对 于 零 阶 张 量 ， 亦 即 标 量 ， 校 正 模型 很 简单 ，r 一 必 十 。， 其 中 表示 仪器 响应 量 ， 表示 
待 油 物 的 浓度 ，e 表示 量 测 误差 :为 其 估计 量 GR 6-1)。 对 于 这 样 的 量 测 模型 ， 一 般 用 简单 
最 小 二 乘 即 可 求解 。 对 此 校正 模型 , IUPAC 给 出 了 分 析 化 学 家 常用 的 灵敏 度 、 选 抒 性 、 信 只 
比 、 检 测 下 限 。 在 此 值得 讨论 一 下 的 是 选择 性 的 概念 。 选择 性 一 般 是 非 对 于 共存 干扰 而 言 , 对 
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AA п 被 测 物种 体系 , 如 某 物 种 ; 的 灵敏 度 为 较 大 正 数 . 此 余 物 种 的 灵敏度 均等 于 零 或 为 接 
近 噶 声 的 响应 ， 财 称 该 分 析 方 法 对 物种 1 具有 完全 选择 性 ， 反之， 该 法 对 物种 i 的 选择 性 差 。 
显然 , 对 于 标量 校正 模型 + 二 c 必 十 e， 一 般 要 求 最 好 是 具有 完全 选择 性 , BM, 待 测 物 的 定量 就 
不 准确 了 。 


der 张 量 校正 理论 的 基本 公式 


-MKH 
零 阶 张 基 -一 -一 ZEE 
直接 校正 BE Rit | 

r= +e — —— be Гума 
с=т» c=(K'K) IKE b=Rte NARs = rankC M) — rank (MIN) 

NAS = G- KK r i NAS| 一 1 15 

SEL — || NAS, I ^ lie ll SEL= NAS. г Ie INI —1 
SEN 一 (Ar/ac) =b SEN,= | | SEN— | NAS SEN= | NAS» |, 

a= ПКК) е] e= 1Е1 
SiN=r/e, 
LOD=ke ib LOD = kel SEN, LOD=ke, || ë || ` LOD=he,! | МАЎ» | 


然而 , 对 于 一 阶 张 量 校正 模型 , 情况 就 发 生 了 变化 , 首先 考察 一 下 直接 校 正 模型 + 一 Ke 十 
e, 其 中 表示 混合 物 量 测 矢量 ; 下 表示 该 混合 体系 所 含 物种 的 所 有 纯 物 种 量 测 谱 ， 也 称 校 正 
矩阵; с 表示 待 求 的 混合 物 各 物种 的 浓度 矢量 ，e 为 量 测 误差 矢量 。 对 于 这 样 的 校正 模型 ， 可 
容易 的 用 多 元 最 小 二 乘 回 归 直 接 求 出 ， 即 ec 一 《KK)- KRr。 这 就 是 说 ， 对 于 一 阶 张 量 校正 模 
型 , 其 选择 性 将 大 大 提高 , 即 在 定性 已 知 干扰 存在 下 , 仍 可 定量 测定 待 求 物种 ; 的 浓度 。 当然， 
为 此 得 先 求 出 该 物种 的 所 谓 的 纯 分 析 信 号 矢量 NAS, Cnet analytical signal) Ж, HI NAS, = (1— 
KK), 其 中 K, 表示 删 去 了 该 混合 体系 待 求 掀 种 的 纯 物种 景 测 谱 大 的 校正 佐 阵 ,Ki RRE 
UOR (参见 第 十 一 章 ) 。 求 得 纯 分 析 信号 矢量 NAS 后 , 直接 校正 模型 r 二 Kc-+e 即 可 化 为 
像 零 阶 张 量 模 型 一 样 , 继 用 表 6-1 所 列 公式 即 可 求 得 所 有 的 分 析 工 作者 所 常用 的 灵敏 度 ,选择 
F. 信 品 比 、 检 测 下 限 来 〈 详 细 推导 参见 本 章 第 二 节 )。 值得 指出 的 是 ， 如 果 各 纯 物 质量 测 谱 
相互 严重 重合 或 相似 ， 这 样 就 会 导致 对 该 物 种 定量 分 析 的 准确 度 有 所 下 降 ， 甚 至 导致 该 分 析 
体系 成 为 “病态 ”体系 而 难于 准确 定量 (参见 本 章 第 二 和 节 )， 所 以 ， 其 选择 性 还 未 法 到 完全 选 
择 。 对 于 问 接 校正 模型 ， 也 可 求 得 所 有 的 分 析 化 学 家 常用 的 有 灵敏度、 选择 性 、 信 噪 比 、 检 测 
下 限 ， 有 兴趣 的 读者 可 参阅 文献 LS]。 

如 果 可 更 进一步 得 到 二 阶 张 量 , 即 矩 阵 形式 的 量 测 数据 , 例如 激发 发 射 二 维 荧光 光谱 , 情 
况 可 发 生 更 大 变化 。 就 可 在 未 知 干扰 的 存在 下 直接 对 待 测 物 种 进行 定量 解析 。 二 阶 张 量 的 校 
正 模型 为 Mw 二 Nw2, 在 此 ,M 表示 混合 物 量 测 矩 阵 数据 ,NN 表示 需 待 济 物 种 的 标准 量 测 短 阵 ; 
风 为 特征 向 量 矩阵 ， 4 为 其 相对 应 的 特征 值 短 降 , 这 在 数学 上 是 一 个 广义 特征 值 问题 (参见 第 
十 一 章 》。 对 于 这 样 的 校正 模型 ， 我 们 可 首先 得 到 待 测 物种 的 纯 分 析 物 种 的 秩 , 即 NAR (net 
analyte rank), NARw=rank (M) 一 rank (MIN), 其 中 rank (MIN 表示 在 MM 中 除去 N 的 
秩 。 注 意 到 此 二 阶 张 量 校正 模型 的 选择 性 SELw= || NAS; | / || N | 一 1 ,说 明 此 类 模型 具有 完 
全 选择 性 ， 故 可 在 未 知 干扰 存在 下 直接 对 待 求 物种 进行 定量 解析 。 所 以 说 ， 随 着 数据 维 数 的 
增加 ， 待 测 物种 的 定量 选择 性 也 跟随 着 增加 ， 这 被 称 为 维 数 优势 。 有关 二 阶 张 量 模型 的 详细 
解析 ， 读 者 可 参阅 本 章 第 三 节 。 

这 三 类 校正 模型 的 优 缺 点 可 总 结 列表 《〈 表 6-2)。 
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表 6-2 =Ж@ matt A 

数据 院 数 | аиан CAN | SARREREN ETT, 
BERE FERRE 17 [abies ee hia И 
最 大 可 分 析 物 种 数 |1 分 折 信 好 通道 数 和 外 析 信 号 通道 数 
FR ELI LM LIE fed WE. АЛО А AUR R 能 检测 ， 分 析 结果 准确 
信和 号 平均 不 能 мі тадия ALT LARA SE 

жп 
统计 人 性质 BUR. (UE BR. CRANE 运 需 继续 研究 
第 二 节 和 白色 分 析 体 系 的 多 元 校正 方法 


白色 分 析 体 系 是 分 析 化 学 中 常见 的 一 类 分 析 体系 。 其 主要 特征 为 ， 该 分 析 体 系 的 化 学 组 
成 已 知 ， 其 分 析 目 的 只 是 对 共存 的 部 分 或 全 部 化 学 组 分 进行 定量 分 析 ， 一 般 说 来 ， 可用 下 列 
线性 加 合 数学 模型 表 出 

у= ах Fax ter texte (6-1) 
AP. yRO BRAWN WAM RAI, RARER- x G=1, 2, =, n) 为 纯 物 质 的 
量 测 矢 量 〈 或 为 纯 光谱 ， 或 为 其 他 纯 物 质谱 )，e 为 量 测 误差 矢量 . 一般 假设 为 服从 正 态 分 布 
的 等 方差 白 噪声 误差 , п 为 混合 体系 的 共存 物种 数 ，c (4 一 1，2，…、 n) 为 末 知 待 估 和 参数 , 一 
般 串 看 成 为 相对 浓度 。 如 果 采 用 年 阵 硼 示 ， 式 (6-1) 可 改写 为 
y=Xc+e 
о), DPR ARE. e= (cu с. зз, 


(6-2) 
s). ARAM SUE E. 


XU. Xsis л. + 
或 称 为 待 浏 浓度 矢量 。 

对 由 式 (6-1) 和 式 (6-2) 表 上 出 的 多 组 分 分 析 体 系 的 数学 模型 ,分析 化 学 计量 学 根据 不 同 
的 实验 条 件 和 不 同 仪器 所 产生 数据 的 不 同 特性 , 已 有 不 少 方法 进行 解 折 , 本 章 将 以 直接 校正 ， 
间接 校正 ， 通 用 标准 加 入 法 为 线索 ,分 别 加 以 介绍 和 讨论 。 


一 、 直 接 校 正方 法 


直接 校正 方法 根据 所 采用 的 不 同 数学 方法 , 可 分 为 多 元 线性 同 归 方 法 (MLR), Kalman BË 
波 方法 《KF) 和 加 权 最 小 二 乘 回归 法 (WLSR)， 下 面 将 分 别 给 予 介绍 。 

《一 ) 多 元 线性 回归 方法 

【基本 思路 ] 

多 元 线性 回归 方法 为 一 常规 的 统计 解析 方法 ， 可 适应 于 由 式 (6-1) 或 式 (6-2) 的 未 知 参 
数 的 估计 。 此 法 直观 简单 ， 而 且 具 有 良好 的 统计 特性 故 在 分 析 化 学 计量 学 中 得 到 了 广泛 的 
应 用 。 注意 到 由 式 (6-1) ЖХ (6-2) 表 出 的 关系 式 中 均 含 有 一 随机 其 测 误差 e, 为 使 所 估量 
测 矢 量 与 实际 蜡 测 矢量 的 误差 最 小 , ARR OR ik. MEEO- Cy) mee 趋 于 


最 小 , 令 


f(O=(y—y' y—y) = (у Хе) (y—Xe)=ee= X e (6-3) 
А (6-3) 中 ， 只 有 * 为 未 知 量 ， 故 可 对 其 求 导 而 获得 /Cc) 的 最 小 。 因 为 
F= (у Хо) у Хо) =y yy (Xe) QOO y + (Xe)! (Xe) 
= yly—y'Ke—€XyteX'Xe 
=yy—2y'KeteX'Xe (6-4) 


ER (6-4) 的 推导 中 , 因 y Xc 为 一 标量 , WA y Xe=c' Xy, MR (6-4) 求 导 可 得 (参见 第 十 一 
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章 )， 
df(c)/de— —2X'y-+2X'Xc 《6-5a) 
ФА (6-5a) 等 于 零 ， 立即 可 得 
X'Xe=X'y 
亦 即 
c= (ХЖ) IXY (6-5b) 


XX (6-5b) 所 求解 一 般 称 为 最 小 二 乘 解 .只 要 由 式 〈6-2) 确定 的 数学 模型 中 的 假设 成 立 ， 
即 量 浏 误差 的 确 服 从 高 斯 正 态 分 布 且 具有 零 均 等 方差 的 噪声 , MA (6-51) 给 出 的 解 具有 很 多 
良好 的 统计 性 质 。 AX My 均 为 已 知 量 ,所 以 如 果 采 用 Matlab 编程 , 只 需 一 个 语句 可 算得 结 
果 ， 即 


c=inv(X'X)'X''y 
所 以 ,在 此 对 多 元 线性 回归 不 给 出 基本 算法 Г. 
【基本 性 质 】 
多 元 线性 回归 给 出 的 解 具有 很 多 良好 的 统计 特性 ， 对 此 将 给 出 较 详 细 的 讨论 。 
CO. 最 小 二 收 估 计 c 是 未 知 浓度 矢量 。 的 无 偏 估计 


j c 的 平均 值 为 
a [EG] 
Eor 2 |= 607 
Len Ete) _ 
于 是 有 


E(c)=E[(X'X) Xy]- (XX 'X'E(y) 
= (XX) X'EQOCce) 
=(X'X) 'X'Xe+ Ele) 
在 直接 校正 模型 中 有 关 量 测 误差 最 从 高 斯 正 态 分 布 且 具有 零 均 等 方差 的 噪声 , 即 
Ej@=0 


和 
Cov(e)= ol 
£ 
E(c)= (ЖХ) 'X'Xe=c 
(2) 最 小 二 乘 估计 < 的 方差 阵 为 
Cove) =o (XX)! 


因为 
ECy) =E(Xc+e)=Xe+E(e)— Хе 
Cov() -E((y - EGO Ly - EGO T 1 
=Е[(у—Хс)‹у— Xo']- (ее) =I 
所 以 


€—c— QUX) 'X'y—c=(X'X) X (Xe+e) —c=(X'X) "Xe 
Сох (с) = Со ГО)  X'y]=(X'X) Cov gy X ' 
=(X'X) "X''IXOY'X) ' 4 Q0 7 
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CD MRE e= (900009 у) онл), WA. s X 0° RREME. TERR, m 是 测 
量 点 数 或 波长 数 ，” 是 混合 体系 的 组 分 数 ， 可 称 为 剩余 方差 。 
在 给 出 证 明之 前 ， 先 介绍 一 条 引 理 。 
引 理 设 28 为 xn 维 随机 矢量 ,FE(8) 一 了 ,Cov(8)=Y, 又 4 为 一 二 阶 常数 方 阵 , 则 
E(g'Ag)= f'Af -tr AV) 
特别 地 , 当 Cov Cg) — oL, A 
EQ'Ag) = f'Af ou (A) 
WEB RIA SE tr (AB) =tr(BA) ,并 令 
8-ftg 
式 中 ,了 为 随机 矢量 8 的 均值 ,为 常量 矢量 ,ge 为 一 均值 为 零 的 随机 矢量 , 则 有 
E(gg,)=Cov(g,) =V 
所 以 E(Cg'48) 一 E[CA 十 go ACf +80) ] 
=f'Af-+-2f'AE(g,) +E(g; Ag.) 
=f'Af+-E[ir(g,Ag.)]— f'Af FEDuCAgg)] 
—fFAf-u[ AEG) 1= f'Af +r CAV) 
在 上 述 推导 过 程 中 ,用 到 了 求 迹 运算 与 求 数学 期 望 (或 称 求 均值 ) 运 算 可 交换 的 原理 .利用 以 上 
引 理 , 不 难 证 明 为 o? HERE. 
因为 Е[#}=Е[(у—у)'(у—у)/(т--л)] 
=1/(n—nE[(y—X eY(y—X e>] 
—l/G—OE[QG-XQCIO Xy (y— КОКО XY] 
= 1/ Gn DEL Go«—XGO' X) XD) nx ХОК) !X0y] 
RP Unna OX KR KO! GL. X(X'X) XO BA SFP W TTT 
ECG) =E(X 2) = ХЕС) — Xe 
ЯК ХО) X038 АРЕН, , 故 有 
Unya ХОК) X0 Unen XXT X) 
БАЕ (00 000 t - (X(X:X) 0 X GÉOCX0 XY): 
—LasOQO!X) X) 
利用 前 述 引 理 , 可 得 
(XoY Gus 7 XGOCX) 7 XO Xe) 
—eQOUx XY OC X)X'X)e 
=e (0)e=0 (6-6a) 
tru — X(X'X) U X0 
Str nxn) —tr(X(X'X) XY 
=) XOT XX) 
Str Uned ПО) тя (6-6b) 
结合 上 述 式 (6-6) 两 式 成 立即 可 得 
E[s?*]=1/(m—n) X (0+ Gano") =o (6-7) 
Са) 只 要 有 关 量 测 误差 为 服从 高 斯 正 态 分 布 且 具 有 和 零 均等 方差 的 噪声 的 假设 成 立 ， 最 小 
二 乘 估计 为 相合 估计 ， 即 
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limCov(e)=hme’ (XX) lime! /m[ XX im) '1 
—limo! /mQF) —0 (6-8) 
这 是 因为 式 (6-8) ФР РЕ ИГ ВЕ. 这 一 关系 说 明 ,， 只 有 有 关 假 设 成 立 ， 基 测 
点 越 多 ,估计 浓 度 的 方差 越 小 。 

G) 只 要 有 关 量 测 误差 为 服从 高 斯 正 态 分 布 几 具有 和 零 均 等 方 状 曲 声 的 假设 成 立 ， 则 在 全 
部 线性 无 偏 估计 类 中 ,最 小 二 季 佑 计 是 唯一 的 一 个 方差 一 致 最 小 估计 (Gauss-Markov 定律 )。 
因 Gauss-Markov 定律 的 证 明 需 用 到 一 些 不 常用 的 统计 学 定理 ， 在 此 从 略 。 

从 以 上 讨论 可 以 看 出 , 景 小 -- 乘 估计 的 确 具 有 很 好 的 统计 学 特性 故 虽 此 方法 很 古老 ,还 
省 在 分 析 化 学 计量 学 中 得 到 广泛 地 应 用 '"”"*'。 因 其 是 直接 用 纯 物质 谱 来 进行 混合 体系 的 浓度 
校正 ， 故 有 直接 校正 之 称 。 

在 分 析 化 学 计量 学 的 多 元 校正 方法 中 ， 最 优 量 测 点 〈 在 光谱 分 析 中 为 波 氏 ) 的 选择 一 直 
是 一 个 研究 课题 。 在 分 析 化 学 中 ， 为 测定 多 组 分 ， 闪 常用 多 波长 方 法 。 现 在 根据 LERE 
最 小 二 乘 估计 的 性 质 ， 还 对 此 问题 进行 … 下 分 析 。 

在 最 优 量 测 点 的 选择 标准 中 ,最 著名 的 和 月 以 下 3 种 ;上 佑 计 值 的 均 方差 标准 - MSE- 
cr (XX); QD 敏感 度 矩阵 行列 式 标准 中 ,Sder(X'X); D 敏感 庶 托 阵 条 件数 标准 并 ， 
Cond(X)=Cənd (XO, EW Cond (+) 表示 条 件数 . 这 3 个 标准 有 一 定 内 在 联系 ， 只 而 进 
行 很 简单 代数 运算 ， 可 得 

MSE=etr(X'X) sti XQ == XA (6-9) 
RP, OA ERM, A ОХ) BIEBER A POI, WEA 
fH (参阅 第 十 一 章 )。 


S =det(X'X)=det(0'Q)der(X'X)=dcet(Q')der(@)der(X'X) 


= det (Q det 00е (Q) = det (PX XQ = 114 (6-19) 
dk Co- 10041 S FORA 的 意义 同 前 ,并 利用 到 行列 式 的 一 些 运 算 性 质 ( 参 阅 第 十 一 章 )。 
Cond( X) =Cond(X*X) =Max(a)/Min(A) (6-11) 


式 (6-11) 是 条 件数 的 定义 ,其 中 义 (i 二 1,2,… sn) 的 意义 同 前 。 

从 以 上 (6-9)~ (6-11) 三 式 可 以 看 出 ，3 个 数值 标准 都 可 用 敏感 度 矩 阵 的 协 方差 矩阵 之 
特征 值 表 出 ， 说 明了 它们 具有 的 某 些 共同 特 住 。 值 得 提出 的 是 ， 这 3 个 标准 都 对 最 小 的 特征 
值 很 敏感 ,说 明了 它们 与 敏感 度 窍 阵 的 共 线性 有 关 . 图 6.3 给 出 了 这 3 个 标准 用 于 两 个 实际 分 
析 体 系 的 数值 变化 与 量 测 点 数 的 关系 ， 可 以 看 出 ， 估 计 值 均 方 益 标 准 和 敏感 度 矩阵 行列 式 标 
准 的 数值 都 随 着 量 测 点 数 的 增加 而 减少 ， 具 有 相近 的 特性 .这 与 前 面 讨论 的 最 小 二 乘 估计 的 
性 质 (4) 是 吻合 的 。 敏 感度 矩阵 条 件数 标准 却 不 具备 这 一 统计 学 特性 "'…。 从 这 些 结果 可 以 看 
出 ， 只 要 有 关 量 测 误差 确 为 高 斯 正 态 分 布 且 具 有 有 夫 均等 方差 ， 出 量 测 点 越 多 ， 佑 计 沙 度 的 方 
差 越 小 ， 也 就 是 说 ， 在 一 般 情 况 下 ， 只 要 不 引进 非 线 性 量 测 点 ,应 该 是 量 测 点 越 多 越 好 。 而 
且 , 从 图 6-3 也 可 以 看 出 ,对 于 二 组 分 和 三 组 分 分 析 体 系 , 当 只 取 2 个 和 3 个 量 测 点 来 校正 时 ， 
估计 值 均 方差 标准 和 敏感 度 矩 阵 行列 式 标 准 的 数值 都 较 大 ， 即 估计 值 均 方 差 较 大 ， 直 到 量 测 
点 数目 大 于 10 以 上 时 , 变化 不 趋 于 平稳 ,这 说 明 最 好 能 多 取 些 量 测 点 来 进行 校正 。 从 这 一 角 
度 看 ,经 典 分 析 化 学 中 用 多 波长 方法 来 测定 多 组 分 似 很 难保 证 估计 浓度 的 方差 最 小 ， 随 着 计 
算 技 术 的 发 展 , 应 该 用 多 元 校 止 来 取代 ,图 6-4 示 出 的 3 个 分 析 体 系 的 分 析 结 果 与 波长 数 的 关 
系 也 确实 支持 这 一 结论 。 


203 


根据 Gauss-Markov 定律 ， 在 全 部 线性 
无 偏 估计 类 中， 最 小 二 乘 估计 是 唯一 的 一 
个 方差 一 至 最 小 估计 (特性 50 ,通常 也 把 这 
个 定理 作为 最 小 二 乘 估计 优越 性 的 一 个 重 
要 论据 , 但 是 在 此 值得 提出 的 是 , 在 承认 这 
一 点 的 同时 也 应 当 注 意 到 ， CD 此 定理 是 在 
量 测 误差 哆 为 高 斯 正 态 分 布 旦 具有 零 均 等 
方差 的 假设 的 前 握 下 才 成 立 ， 而 在 一 个 具 
体 场合 下 ,此 假设 是 否 合理 是 可 以 讨论 的 ， 
并 非 自然 成 立 。 O 此 定理 中 “方差 最 小 ”的 
结论 , 是 在 “无 偏 ” 的 限制 下 得 到 的 。 如 果 
不 局 限于 无 偏 估计 ， 可 香 找到 另 一 些 估计， 
在 某 种 意义 上 优 于 最 小 二 乘 估计 ? 这 也 是 
可 以 讨论 的 问题 。 事实 上 ， 在 以 后 的 讨论 
中 , 可 以 着 到 , 对 于 所 谓 的 “病态 ”分 析 体 


系 ， 有 偏 估计 就 具有 某 些 优越 性 。 БЕ 

(=) Kalman ЖЖ E 

Kalman 小波 为 信号 处 理 中 一 种 最 优 
线性 递 推 滤波 方法 ， 因 其 是 一 种 递 推算 法 ， 
具有 计算 速度 快 且 所 需 计算 机 内 存 少 的 特 
点 故 在 工程 实 趴 中 , 特别 在 航空 空间 技术 
中 得 到 广泛 应 用 。Kalman 滤波 首先 由 w 
Rutan 等 引 人 化 学 计量 学 0 中 ,很 快 在 分 析 图 6-3 REAM GO 与 3 个 标准 的 关系 
化 学 计量 学 的 多 元 校正 中 得 到 应 用 。 递 推 анын авик 
运算 是 Kalman 滤波 方法 的 一 重要 特点 , 在 O HHS ER 
讨论 Kalman 滤波 方法 前 , 似 有 必要 对 递归 17e nan eo 


运算 给 出 简要 介绍 。 


图 6-4 波长 点 数 Ол) SHORE EM RR 
波长 点 序列 是 按 最 优 方法 选 出 
1 一 二 组 分 体系 : 2 一 三 组 分 体系 : 3- 四 组 分 体系 
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递归 运算 的 基本 思想 是 有 效 地 利用 已 经 得 到 的 结果 和 最 新 的 观察 值 来 进行 计算 ， 以 避免 
不 必要 的 重复 。 这 种 递归 运算 的 特征 .可 用 均值 的 计算 为 例 米 很 好 地 加 以 说 明 。 芍 值 运 算 一 
般 采 用 下 式 


=N xn (6-12) 

式 中 , У z 表示 对 #4 个 观察 值 x, 求 和 ,在 测 得 一 个 新 的 .x (га D 后 ,如 用 式 (6-12) + 

算 就 必须 一 切 从 头 算 起 , 原始 的 个 观察 值 都 必须 存储 在 计算 机 中 ,试用 递归 方式 运算 , 则 可 
得 到 下 列 算式 ， 它 只 与 前 一 次 的 结果 有 关 ， 而 无 需 再 -次 计算 原始 的 ”个 观察 值 ， 

ER (6-13) 

这 种 方式 显然 比 非 递归 方法 快 且 需 内 存 少 , 特别 适应 实时 运算 , 而 这 正 是 Kalman 滤波 方 
法 相对 于 上 述 非 递归 多 元 线性 回 妇 方法 的 一 重要 优点 。 

【基本 思路 ] 

Kalman 滤波 算法 在 化 学 中 可 用 于 很 多 方 而 . 如 化 学 动力 学 的 速度 常数 的 测定 , 非 平 衡 
状态 的 电位 滴定 “1, 多 组 分 化 学 体系 的 直接 校 止 等 . 在 Kalman 滤波 算法 中 ,首先 定义 了 内 个 
模型 ， 一 为 系统 重型 ， 一 为 量 测 模型 ， 因 本 文 只 讨论 在 直接 校 止 中 应 用 的 Kalman 滤波 算法 ， 
即将 其 看 成 一 -种 递归 型 的 线性 状态 估计 方法 ， 用 来 估计 体系 组 分 浓度 ， 故 在 此 只 给 出 其 简 朗 
形式 , 并 力争 与 上 节 讨 论 的 多 元 线性 回归 方法 使 用 的 符号 一 致 。Kalman 滤波 算法 的 系统 模型 
和 量 测 模型 分 别 由 式 (6-14) 与 式 (6-15) 给 出 : 

cQ) == F(R RL)ek—1) tw UD (6-14) 

а) = О) D teh) (8-15) 
RP, 变量 “代表 一 个 量 测 点 ， 它 可 以 是 时 间 ， 分 析 递 道 如 波长 等 或 其 他 变量 ;ec (4) RER 
HERMA HRE, 在 此 为 分 析 体 系 的 浓度 矢量 ; F (4,，4 一 1) 称 为 系统 的 转移 矩阵 , 它 表 
达 了 系统 如 何 由 & 一 ! 点 的 状态 过 渡 到 “点 的 状态 , 因 静 态 分 析 体 系 的 浓 产 矢量 在 整个 分 析 过 
程 中 不 发 生变 化 ， 故 在 此 它 实际 为 一 单位 矩阵 ，w UD. 代表 系统 的 动态 随机 误差 ， 因 本 书 只 
讨论 静态 分 析 体 系 的 多 组 分 校正 , 故 其 也 可 认为 近似 等 于 一 零 矢 量 ;x(&) 代表 量 测 函 数 矢 量 ， 
它 与 上 节 讨 论 的 多 元 线性 回归 中 的 敏感 度 怎 阵 导 的 第 《 行 相对 应 ; z OO 为 混合 体系 在 上 点 的 
Hd. 与 上 节 讨论 的 多 元 线性 回归 中 的 混合 物 量 测 矢量 中 的 第 4 点 相对 应 ; e СЮ 为 混合 体 
系 在 & 点 的 量 测 误差 , 与 上 节 讨 论 的 多 元 线性 回归 模型 的 假设 相同 ,为 一 服从 高 斯 正 态 分 布 卫 
具有 零 均等 方差 的 白 噪 声 系列 。 

Kalman 滤波 方法 用 于 多 元 校正 是 采用 递归 来 进行 的 , 即 利 用 系列 点 的 量 测 值 来 进行 体系 
浓度 估计 ， 直 至 得 到 稳定 的 ， 最 优 的 浓度 估计 值 。 它 的 核心 递 推 估计 方 吾 如 下 

eG) —e(G— Dg D [sGD —x eG - 10] (6-16) 
式 中 ,ck) 表 示 由 个 量 测 点 所 估计 出 的 浓度 矢量 ,而 ce(% 一 1) 则 表示 由 (% 一 1) 个 量 测 点 所 估 
计 出 的 浓度 矢量 ;[zC&8) 一 x(&)'e(4 一 1)] 实 际 就 表示 在 点 上 混合 体系 的 量 测 值 与 估计 值 之 
差 ,只 不 过 此 估计 值 是 由 cC% 一 1) 算 出 , 即 是 只 基于 (一 1 个 量 测 点 所 估计 出 的 。 

式 (6-16) 中 最 重要 的 是 g D CPW Kalman 滤波 中 的 增益 矢量 ,如 果 把 式 (6-16) 与 式 (6- 
13) 比 较 , 可 以 看 出 此 增益 矢量 与 式 (6-13) 中 的 1/n 是 相对 应 的 。 从 式 (6-16) 还 可 以 看 到 ， 
Kalman 滤波 在 第 点 对 ce(&) 作 出 的 估计 ,是 建立 在 第 (4 一 1) 点 以 前 艾 量 测 所 得 浓度 矢量 
5 全 一 1) 估 计 的 基础 上 ,再 考虑 新 的 第 不 点 的 量 测 值 与 按 原 估计 的 染 度 矢量 ce(% 一 1) 计 算 应 有 
的 响应 值 的 差异 乘 上 增益 矢量 而 得 。Kalman 滤波 增益 矢量 的 计算 由 下 式 给 出 ; 

BE) = PG— xR Exh PG — Dx r0] ! (6-17) 
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式 中 ,r (aS (OHTE E-E PA DEAM- 1 个 量 测 点 估计 所 得 的 系统 
协 方差 矩阵 ,其 自身 在 第 点 的 估计 可 由 式 (6-18) 给 出 : 
POSU gR 1)х ССРО 0р0 Lab T tee DrGDgG- 1) (6-18) 

SHE Ty A Е. 

【基本 算法 了 

从 到 上 对 Kalman 滤波 算法 的 介绍 可 以 看 出 ,只 要 给 出 ct#) 和 Pt) 的 初始 值 , 即 <(0) 和 
PC) ,就 可 访 式 (6-17) 计 算 其 增益 矢量 ,然后 按 式 (6-16; 和 式 (6-18) 计 自 下 一 个 et&8) 和 PCk)， 
HERK. PLA , Kalman 滤波 具体 算法 可 由 下 列 步骤 组 成 ; 

(1) Eu 


(0) =O, PCO — YT 
— uji OC) = 0, PCO 71. XX EB LORS SR RE? A BO IERI A E AT ES 
验 式 (6-19) 估 出: 
Psar Vixa x} (6-19) 
式 中 ,a 为 一 与 计算 机 精度 相关 的 因子 ，- 般 串 取 10—100. ABR HMR. POOR AA. A 
导致 有 偏 估 计 , 如 取 值 本 大 , 则 尽管 参量 的 估计 值 是 无 售 的 .而 由 于 量 测 点 数 不 足够 大 时 ， 
PC(0) 的 最 终 估计 和 值 仍 会 偏 大 。 
(2) 启动 计算 
вО) PG—DxGO [e POR Dek tr) 
eG) =elk D gOD[zGD СОСЕ —-01 
Ре) LI gk Dx) PU DIE glk Drag Drege 1Y 
RP, rh) 是 量 测 噪声 e(8) 的 方差 , RETR TSAR SE. 重复 此 步 计 算 直至 
浓度 估计 值 趋 于 稳定 。 
【重要 性 质 】 
在 Kalman 滤波 算法 中 ,新 息 序 别 是 一 个 很 重要 的 概念 , 它 可 提供 关于 速 波 结果 是 否 名 靠 
的 信息 。 新 息 系 列 可 由 式 (6-20) RH: 
vU) вв) x(k) ck 1) (6-20) 
Mo (6-20) 可 以 看 出 ， 新 息 序 列 实际 就 表 
示 在 点 上 的 量 测 秆 与 合计 和 值 之 差 , 相当 于 多 元 o.zh 
REMAP RARE. MRT EM, 
新 息 序列 应 为 一 零 均 白 噪声 系列 ， 如 果 滤 波 不 正 
常 ， 新 息 序 列 将 成 为 相关 的 〔 人 参见 图 6-5)， 这 说 -v Qo 
明 或 是 体系 存在 背景 ， 或 是 体系 存在 未 知 干扰 
物 ，Kalman gii SERA RI R, 
(=) 加 权 最 小 二 乘 回 归 法 " 
在 前 两 节 的 讨论 中 ,， 一般 都 假设 量 测 误差 是 s оо 
服从 零 均 等 方差 的 正太 分布 ， 然 而 ， 在 分 析 化 学 O - 
HEMP, 有 时 这 一 假 没 并 不 可 能 满足 。 在 这 一 e» 
тр, 将 讨论 当量 测 误差 如 是 不 等 性 方差 时 ,多 Eoo ШШДЕ (NAO 
元 校正 是 采用 什么 方法 来 进行 浓度 估计 的 .加权 б) 正常 滤波 ，(b) FLERE 
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最 小 二 乘 回归 法 就 是 这 样 一 种 方法 。 
【基本 思路 】 
ER (6-3) "P, 每 个 谋 差 值 e*(i==1,2,…,m) 的 系数 都 是 1， 即 存 最 小 二 乘 方 法 的 旦 标 函 
数 中 每 个 误差 值 都 是 “等 权 ” 的 。 然 而 ,这 就 暗示 此 法 只 有 在 各 量 测 误 差 都 相同 的 情况 下 才 
是 合理 的 。 事 实 上 ,在 分 析 化 学 的 量 测 中 , 量 测 值 在 不 同 的 量 测 范围 内 ， 量 测 精度 往往 不 同 、 
因而 量 测 误差 也 不 尽 相 同 . 这 种 情况 在 光谱 分 析 中 很 常见 ,合理 的 方法 蚌 对 不 同 的 误差 项 e? 加 
AMAL, MER (6-3) 写成 
(c) => we? (6-21) 
当量 测 值 的 精度 高 时 ,rw: 大 ,反之 ,wv, 小 ,这样 可 以 使 拟 合 的 曲线 非常 接近 于 精度 高 的 点 ， 
保证 拟 合 的 准确 度 高 。 
EE Scd MRRP SOUS RK 
fO= У лое ее (ууу (уу) = (у XOW Хо) (6-22) 
在 这 里 ,W 为 一 mXm WE H RB G WE v G= 1,2. r0 АЯН IE 
式 56-22) 中 ,只 有 * 为 未 知 量 , 故 可 对 其 求 导 而 获得 OWRD. AW 
LO = (y—Xce)'W(y— Xc) 
=yWy—yW(Xe)-- (Хе) Wy (Xe)'W (Xe) 


=y'Wy—2yWXe+eX'WXe (6-22) 
对 式 (6-23) 求 导 可 得 
df (e) /de= —2X'Wy--2X'WXc (6-24) 
令 式 (6-24) 等 于 零 , 立 即 可 得 
X'WXc=X'Wy (6-25) 
亦 即 
c=(X'WX) 'X'Wy (6-26) 


ica Re So Le SPEI, ELERES OF ea AS TERT BEL AE RR Hc 
性 。 为 了 比较 加 权 最 小 二 乘 估 计 与 多 元 线性 回归 之 闻 的 关系 , 仿 定 
E(e)=0 
和 
Cov(e)=E tee) =V 
在 此 没有 要 求 量 测 误差 (e) 服 从 正 态 分 布 ,而 且 量 测 误差 的 协 方 差 矩阵 也 不 是 一 个 常数 对 角 
阵 , 即 不 相关 且 具 等 方差 的 量 测 误差 。 
【基本 性 质 】 
关于 W 的 选择 问题 在 后 面 讨论 。 现 在 先 讨 论 W 为 一 般 矩 阵 时 的 加 权 最 小 二 乘 估计 的 一 
些 基本 性 质 。 
а) 加 权 最 小 二 乘 估计 c 是 未 知 浓度 矢量 c 的 无 偏 估 计 
E(e)=EL(X'WX) XWy]- (КЕСУ) 
=(X'WX) 'X'WE (Xc+ e) 
=(X'WY) X WXe+Ete) 
FATO Eg S RU SERI PERS, Вр E(e) 一 0, 所 以 有 
Ete) = (ЧУХ) !Y'WXe-c 
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(2) 加 权 最 小 二 乘 估计 e 的 方差 阵 为 
Соу(с) ХХ! 
因为 
стс =(X'WX)'!X'Wy с 
=(X'WX) X'WOc-e-c 
= (ХХ) X'We 
Собе) = Е[ е - Ce - 07 
=Cov (XWX) X We] 
=(X'WX) 'X'WCov(e)WX(X'WX) | 
=(X'WX) 'XWVWX(X'WX) Г" (6-27) 
ШЖК ИУ “' 式 (6-27) 可 变 为 
Cove) = (ХУ 20 XY "VV 'X(X'V X) 
= (КУХ) Хуу): 
= (КУХ)! (6-28) 
RW=V spar fissi CA BU. AM W=v ! 是 最 优 的 加 权 和 矩阵 。 MAK 
不 等 式 
A'A>(A'B)(B'B) ВА) 
令 V=CC, 实 因为 一 对 称 和 矩阵 ; 青 令 A 一 CWXCXIWX) B= (COX, Д] 
ДА = (X'WX) 'X:'WC'CWX(X'WX) | 
= (XWX) 'X'WVWX(X'WX ! (6-29) 
又 有 
(UD (BB) ВА) = XWX) WC GO XLC OC X]? X TC 9) TCWX WX)? 
=(X'WX) OX WALCO X] 'X'WX(X'WX) ' 
=(X'WX) 'X'WX[X'V 'X) !X'WX(X'WX) ! 
-[Xv Xx]! 
所 以 
(X'WX) 'X'WVWX(X'WX) > XVX] (6-30) 
这 就 说 明了 采用 加 权 最 小 二 乘 时 ,加 权 阵 W Bos v c 所 得 的 估计 误差 的 方差 阵 为 最 小 ， 
有 时 特别 把 加 权 阵 WW 取 为 Y 的 加 权 最 小 二 乘 估 计 , 即 


с (ХУТ) XV^y (6-31) 
称 为 马尔 柯 夫 估计 。 故 一 般 在 实际 运算 中 就 选择 V EA I DEW 
=. AMBRE 


从 上 述 讨论 可 以 看 到 ， 直 接 校 正方 法 直观 且 计 算 简单 ， 易 于 在 计算 机 上 实现 。 但是， 这 
种 方法 不 太 利于 实验 设计 ， 而 生 ， 对 某 些 存 在 轻微 非 线性 的 分 析 体 系 . 其 浓度 估计 的 可 靠 性 
会 有 所 下 降 。 对 很 多 分 析 试 样 人 们 -- 般 可 得 到 它们 的 大 致 浓度 变化 区 间 ， 如 果 此 时 直接 用 一 
些 已 知 浓度 的 混合 物 试 样 ， 继 采用 某 些 实验 设计 方法 ， 如 正 交 设计 或 因子 设计 ， 来 构成 某 种 
训练 集 的 话 ， 所 得 估计 效果 当 有 所 提高 。 这 就 产生 了 在 这 节 要 讨论 的 所 亩 间接 校正 方法 。 

间接 校正 方法 的 基本 思路 是 用 一 些 已 知 浓度 的 混合 物 经 某 种 实验 设计 方法 首先 构成 一 校 
正和 矩阵 了 然后， 利用 这 校正 矩阵 来 找到 这 些 混合 物 量 测 谱 所 对 应 的 各 组 分 纯 物 种 的 量 测 谱 
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СКН Е) Е cr iya ik FS RE RE K (P-HEF), W 
样 一 类 方法 因 其 不 直接 采用 纯 物 种 的 标准 量 测 谱 来 进行 校正 ， 收 统称 为 间接 校正 方法 ， 因 间 
接 校正 方法 是 用 混合 物 量 测 谱 来 直接 估计 未 知 混合 物 量 测 谱 的 各 组 分 浓度 ， 所 以 ， 有 一 定 减 
轻 非 线性 因素 的 功效 。 但是， 在 这 里 有 必要 指出 ， 因 间接 校 让 方法 仍 是 采用 线性 模型 ， 对 于 
非 线 性 严重 的 分 析 体系 仍 不 可 能 得 到 令 人 满意 的 结果 。 对 于 间接 校正 方法 ， 其 一 般 数学 模型 
可 由 《〈6-32》 两 式 给 出 : 


Y-KC (K EER) (6-32а) 
C—PY (P-E) (5-32) 

ХР, PEBE Y jon X p) PMR. "E RH p RCW RMB m 个 分 析 通 道 (可 
为 波长 或 别 的 分 析 通 道 》 量 测 而 得 . 它 的 每 一 列 就 代表 -个 混合 物 的 量 测 谱 ; 矩阵 C 为 ax 
b) КЮРЕШЕ, 它 是 由 p 个 混合 物 的 4 个 组 分 的 浓度 构成 , 它 的 每 一 列表 示 一 个 混合 物 对 
应 的 组 分 浓度 矢量 ; PRY KC, ЖЕК Gn Xn) 阶 的 标准 晤 测 谱 垂 阵 、 它 设 为 个 纯 
组 分 在 x 个 分 析 通 道 量 测 所 得 , 它 的 每 一 列 代 表 一 个 纯 物 质 的 量 测 诺 ; 在 C= PY 中 矩阵 了 和 
A EE C 的 意义 同 前 ; 但 年 阵 己 则 为 GX) 阶 的 回归 系数 年 阵 , 一 般 要 求 mp Amn, ЗЕ 
因 所 用 分 析 道 道 数 必须 大 于 或 至 少 等 于 纯 组 分 数 和 用 作 校 正 的 混合 物 量 测 谱 数 ， 洛 则 无 法 求 
f. 当然 , 这 样 的 条 件 一 般 很 容易 满足 。 就 是 通过 对 上 述 6-32) 两 式 的 解析 , 其 中 尤其 是 对 
XX (6-32b》 的 解析 ,产生 了 著名 的 偏 最 小 二 乘 PLO 和 主 成 分 回归 法 《PCR》 方 法， 下 面 
将 对 这 些 韶 接 校正 方法 作出 较 详细 的 讨论 。 

(一 ) KAER jk 

【基本 思路 

K-38 ШЕН ЖШ Brown 引 人 分 析 化 学 计量 学 :2* .此 方法 的 主要 思路 是 先 通过 混合 物 的 
校正 矩阵 借 最 小 二 乘法 求 得 各 组 分 的 纯 物 种 谱 ， 然 后 再 利用 如 此 求 得 的 纯 物 种 谱 去 求 得 未 知 
待 浏 混合 物 的 各 组 分 的 浓度 ,这 样 做 有 以 下 两 个 好 处 : @ 因 各 组 分 的 纯 物 种 谱 是 由 混合 物 的 
校正 矩阵 求 得 , 故 有 一 定 的 抗 非 线 性 功效 ; D 因 校正 矩 阵 可 由 自己 确定 , 故 可 很 方便 进行 实 
验 设计 ， 这 样 由 实验 设计 所 估计 的 未 知 样本 的 各 组 分 浓度 可 望 更 准确 ， 可 排除 一 些 意外 样本 
(奇异 样本 ) 的 影响 ,KK- 和 矩阵 法 的 基本 数学 模型 由 了 二 KC 胡 示 .为 一 线 些 模型 ， 如 在 光谱 定 
量 分 析 中 ,就 可 看 成 是 Lambert-Beer 定律 ,了 二 KC 中 的 无 实际 上 就 是 纯 物 质 的 标准 光谱 量 测 
和 矩阵， 它 的 每 一 列 就 是 一 个 物种 的 标准 谱 。 

【基本 算法 】 

到 -矩阵 法 的 计算 步骤 如 下 : 

а) 用 最 小 二 乘法 求 出 天， 即 


K-YC(CC)" (6-33) 
或 者 
K'= (CC ')”'!CY' (6-34) 
(2) 用 求 得 的 下 借 最 小 二 乘法 求 出 未 知 混 合体 系 的 浓度 矢量 cka 或 浓度 矩阵 Coes 
Ce = (К'К) Куху (6-35a) 
或 Cas = (КК) КҮ (6-35b) 


这 第 二 步 实 际 就 是 在 第 五 章 讲 的 直接 校正 的 多 元 回归 方法 .从 上 述 计 算 步 骤 可 以 看 出 KE 
法 要 进行 两 次 最 小 二 乘 ， 即 需 责 次 求 着 ， 这 样 就 难免 使 得 计算 误差 变 大 ， 如 果 同 样 是 采用 间 
接 校 正 的 方法 ， 但 只 求 一 次 逆 以 减少 误差 的 传递 扩大 ， 这 就 产生 了 所 谓 的 P- 和 矩阵 法 "1。 
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(=) 产 矩 阵 法 

【基本 思路 】 

PP- 矩阵 法 是 以 C=PY 为 其 数学 模型 ， 直 接 以 校正 矩阵 的 浓度 阵 为 预测 目标， 求 得 回归 系 
数 和 矩阵 P, 直接 从 混合 物 量 测 矩 阵 就 可 求 出 混合 物 的 组 分 浓度 , 这 样 就 避免 了 两 次 求 闻 过程 ， 
简化 了 KERE. 

【基本 算法 】 

也- 和 矩阵 法 的 计算 过 程 如 下 

OD 用 最 小 二 乘法 求 出 产 


Рону Сахт p Y ах Yims s (6-36) 
或 者 
Pieno = ых» ы, py) Yon Сох (6-37) 
(2) 再 用 求 得 的 严 mo съл FUR OB БЕ Crm: 
Cai = Poco Yu (6-38) 
或 
Cam =P, „Ужа (6-39) 


这 样 类 似 于 КЕ НР ВИЗР A, 可是, PP- 第 阵 法 却 不 同 于 KERE 
上 述 过 程 对 КНЕ GEE GS SGN itt РАА ee HU STE Te E). КЕ ЕЕ ЗЕ PURI EEUU 
PRE (CC ') 求 逆 ,这 个 协 方差 阵 是 一 个 xn) WHER, BERR. ЖАП. P-E 
是 对 混合 物 量 测 矩 阵 的 协 方 益 阵 (YY') ЖОЙ, 而 它 是 一 个 (mxXm) 阶 的 矩阵 ， 为 一 奇异 矩阵 。 
解决 的 办 法 是 只 从 闫 个 分 析 通 道 〈 或 为 波长 点 ) 选 出 ”个 来 组 成 新 的 混合 物 量 测 矩 阵 Y， 以 
保证 其 协 方差 阵 满 秩 。 这 样 做 不 仅 有 可 能 丢失 很 多 有 用 信息 ,而且 , 这 个 分 析 通 道 亦 很 难 选 
出 (有关 这 样 的 最 佳 波长 选取 方法 可 参看 文献 [12]). 正如 在 对 多 元 线性 回归 进行 讨论 时 指出 
的 那样 ， 只 要 有 关 量 测 误差 确 为 高 斯 正 态 分 布 且 其 有 零 均 等 方差 ， 则 量 测 点 越 多 ， 估 计 浓 度 
的 方差 越 小 ， 也 就 是 说 , 在 一 般 情 况 下 ， 只 要 不 引进 非 线性 量 测 点 ， 应 该 是 量 测 点 越 多 越 好 。 
所 以 , 以 上 讨论 的 有 关 已 矩阵 法 的 这 一 局 限 大 一 个 很 值得 研究 的 弱点 ， 就 是 对 这 一 弱点 的 克 
服 而 产生 著名 的 主 成 分 回归 法 和 偏 最 小 二 乘法 。 

(三 ) 主 成 分 回归 法 

【基本 思路 】 

主 成 分 回归 法 实际 上 可 以 看 成 是 对 P- 和 矩阵 法 的 一 种 改进 , 它 不 但 可 尽 可 能 多 地 保持 有 用 
信息 , 即 保留 所 有 的 线性 量 测 点 ,而 且 还 保持 了 了 -矩阵 法 的 既 可 进行 实验 设计 又 可 一 步 求解 
的 优点 。 它 采用 多 元 统计 中 的 主 成 分 分 析 方 法 , AAR AURREK Y 矩阵 直接 进行 分 解 , 然 
后 只 取 其 中 的 主 成 分 来 进行 回归 分 析 ， 故 有 主 成 分 回归 之 称 。 对 了 矩阵 进行 直接 分 解 在 数学 
上 有 几 种 方法 ,在 化 学 计量 学 中 一 般 采 用 的 方法 是 非 线性 迭代 偏 最 小 二 乘 算法 (МІРА 5), 
这 种 方法 实际 上 是 沿 于 Von Mises 的 冬 敌 法:。 另 一 种 方法 是 线性 代数 中 常用 的 奇异 值 分 解 
法 《SVD)。 奇 异 值 分 解法 可 将 任意 阶 实数 矩阵 分 解 成 为 3 个 矩阵 的 积 ， 即 

Y—USV' (6-40) 
式 中 ，3 为 对 角 和 矩阵 ， 它 收集 了 了 矩阵 的 特征 值 ， 和 2 SI REN ERES HE TT IE ЗОН 
阵 ， 收 集 了 这 些 特征 值 所 对 密 的 列 特 征 矢 量 和 行 特征 矢量 ， 在 多 元 统计 的 主 威 分 分 析 中 ， 一 
般 被 称 为 得 分 矩阵 和 和 荷载 矩阵 。 主 或 分 分 析 的 数学 与 几何 意义 示意 于 图 676 2i F PR BI C 
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ЖОН C= PY, HR REAR A RAE Y 19) 3G УЗ, 那么,P 矩阵 则 可 以 直接 求 出 ， 即 
P=Cr-。 


à; о 
м — 
O 2 - 


AERE 
(TERE: 


变量 得 分 逢 险 
СЕ) 


ЦЕНЕН 


图 6-6 ERT RE SILA КЖ 


事实 上 ， 利 用 奇异 值 分 解 方 法 ， 是 很 容易 得 到 任意 实数 年 阵 的 广义 递 的 。 任 何 量 测 过 程 
都 存在 着 量 测 误差 ， 所 以 混合 物 量 测 守 阵 可 以 表示 为 
Y=Y°+E (6 41) 
式 中 , Y 408 RS А ИП НЕЕ AAR AR ун (参见 本 章 第 四 节 “一 "), 而 五 则 
表示 误差 矩阵 ， 它 由 被 舍弃 的 即 很 小 的 特征 值 所 代表 的 那 部 分 特征 列 矢量 和 特征 行 矢量 的 乘 
积 而 得 ， 有 时 也 称 为 主 成 分 模型 误差 。 这 部 分 量 测 误差 总 与 Y° 正 交 的 ， 它 与 实际 量 测 误差 不 
完全 同一 。 
BUE GE n 是 体系 的 组 分 数 , 如 果 体系 确 为 线性 体系 , 则 这 种 情况 下 的 体系 主 成 分 数 应 为 
n, 即 此 时 由 坷 异 值 分 解 算法 所 得 的 收集 了 了 怎 阵 的 特征 值 的 对 角 和 矩阵 , 应 是 前 a 个 特征 值 显 
著 大 于 其 余 的 特征 值 ， 它 们 已 包括 了 该 年 阵 的 全 部 的 化 学 信息 ， 实 因 混 合体 系 中 化 学 物种 数 
就 等 于 该 混合 物 量 测 失 阵 的 秩 。 一 般 只 需 取 前 个 特征 值 和 特征 矢量 作为 主 成 分 (有 非 线性 因 
素 存在 时 , 主 成 分 数 可 大 于 ,在 化 学 计量 学 中 一 般 用 交叉 校 验方 法 来 确定 所 需 主 成 分 数 ), 其 
余部 分 可 看 成 误差 被 丢弃 。 如 记 只 取 前 个 特征 值 的 8 矩阵 为 8, 记 只 取 前 4 个 相对 应 的 特 
TEASE UU S ,荷载 短 阵 V AV, WA 


y-usy- (6-422) 
WR (6-42) TARER d MIR T ELA BEER ЗЕ B) S Tia Cr D Et B| SE BE: y° 8 Ий 
Yt =V (kp (6-42b) 


容易 证 明 ,7 了 ”的确 满足 广义 道 定 义 的 4 个 条 件 ( 参 见 第 十 一 章 。 
求 得 噜 除了 误差 的 量 测 矩 阵 Y^ ЮГ ЙҮ" , 主 成 分 回归 法 的 计算 过 程 就 不 难说 明了 。 
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【基本 算法 了 
在 此 将 介绍 两 种 算法 
a) WikI 
D) ШИШ ШЕШ R (8-42Ь)›Ж BLR BE IT ЖОШ YT ,然后 ,用 它 求 出 回归 系数 年 
БЕР 
P—CY* —CV' (S')U" £6-43) 
2) 在 用 求 得 的 P ABEL AT TT MER RR PEOR EG TREO BE ee ЁРЕ E EBE Com: 


Cam = Ружы 


Cau — PY am 
从 上 述 讨 论 中 , SI LA, 主 成 分 回归 法 既 保持 了 PERE INET RITA 
步 计 算 的 优点 ,又 克服 了 了 -矩阵 法 要 丢失 大 部 分 量 测 信息 及 损失 估计 准确 性 的 弱点 ,人 确 为 一 
很 好 的 间接 校正 方法 ， 近 年 来 在 化 学 计量 学 中 得 到 了 广泛 的 应 用 : 呈 。 
(2) 算法 TI 
D 对 混合 物 量 测 符 阵 了 进行 正 交 分 解 ， 即 
Y-USV—-U'$ Y^ =U G" (6-44) 
EREU SVMS. 实际 上 , 这 一 正 交 分 解 就 相当 于 十 成 分 重 构 , HLAS V = 
G', WIB G” 仍 为 一 行 正 交 和 矩 阵 、 只 是 不 是 标准 行 正 交 矩阵 而 已。 
D HG 对 浓度 阵 忆 进行 回归 可 得 回归 系数 阵 К. Праў C 一 RG 式 进 行 最 小 二 乘 运算 : 
R =CG'(GUG' — COP S! (SVE VES ! »C(* ST GS 8207 
=C(W'S* (S72) CY (0S 
D 预测 未 知 样本 量 测 矩 阵 了 #m， 因 为 
Yau =U’ Gen 


所 以 
Са =U Yan 
再 利用 Саа = Ско, ПИ 
Cox = RGga =RU Yan 
ЖЇН C#m。 事实 上 
Cam = RU Ya | =CV'(S') U Yaa СУ (87) Yan 
=СҮ° Ygag =СҮ Y ou 
—PYus 
可 见 ， 这 两 种 计算 过 程 殊途同归 ， 
(EO 偏 最 小 二 乘法 
【基本 思路 】 
主 成 分 回归 方法 的 主要 思想 是 直接 对 混合 物 量 油 和 矩阵 了 进行 正 交 分 解 ， 继 而 用 浓度 矩阵 
C 对 被 分 解 的 正 交 主 成 分 进行 回归 。 偏 最 小 二 乘法 则 更 进一步 , 它 不 但 对 混合 物 基 测 矩 阵 Y 进 
FEXR, 而且 在 分 解 Y 的 同时 将 浓度 矩阵 C 也 进行 正 交 分 解 ， 这 样 浓度 矩阵 的 主 成 分 也 
被 分 离 出 来 : 
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Y—-USV'—U'S'V"- E,-T^V" +E; (6-45a) 

C=PG0'—P'G'0U +E =R O’ +E (6-45b) 
AP. ANE PVP SE APE Y DAR SKER TB EEC ЛА АОН Е К”, FEE 
TRA K A Ө Jes A AR EE PS QU. HL. 在 进行 同时 分 解 时 . ëB Y EE TE 
丸 "之 间 应 有 的 线性 关系 ， 这 就 构成 了 偏 最 小 二 乘法 不 同 于 主 成 分 回归 的 主要 之 点 ， 即 在 分 解 
矩阵 了 时 考虑 矩阵 C 的 因素 , 而 在 分 解 策 阵 C 时 考虑 矩阵 7 的 因素 ， 交 互 校 验 相互 影响 . 通 
过 迄 代 时 交换 迭代 矢量 而 使 两 个 分 解 过 程 合 一 为 一 。 

【基本 算法 】 

偏 最 小 二 乘法 的 选 代 过 程 是 通过 由 H. Wod ЖН ККЕ Ж ҮЕ ЖК ИШ Л RAR 
(NIPALS) 而 完成 的 。 具体 计算 步骤 如 下 ， 

D 取 浓 度 阵 C 的 某 一 列 、 记 为 r， 作 分 解 的 初始 迭代 失 量 。 

2) 以 ~ 代替 了 "矩阵 的 分 解 矢量 上: 来 计算 v， OI 矩阵 的 一 行 )， 

y'—rY/G'r) 
(注意 : 以 上 两 步 等 于 是 用 浓度 阵 C f — Ж {ЕБ ЖЕНЕ BOR ET YORE RE SEA) AR. Bl 
分 解 Y E RETA FA PE C 的 信息 .) 

D ЕКА BET REAL ( 归 一 化 处 理 : vy mr silvis || 

DE ES US TERRA t= Yv (vy) 

5) д: PUER ЕЗЕШ ЖЛЕ B r RITA (QU 矩阵 的 一 行 ): 

дегс/а') 
(注意 : 这 一 步 等 于 是 用 Y 矩阵 的 分 解 矢量 # 来 作为 C Hi BEB0 IF 2 2 ft XE 以 得 到 其 另 一 正 
SERIE (OUER) 的 一 行 。 这 说 明 分 解 浓度 阵 C 时 也 利用 了 矩阵 的 信息 .) 

O HERRE q' 进行 标准 化 《 妇 一 化 处 理 : a 一 ga/ Il gin | 

D 由 对 来 计算 矢量 (RSP MP) :r= 二 Xq ag) 

8) XC СОК, BE tg etae 是 否 小 于 某 -给 定常 数 9。 如 收 合 则 开始 下 一 步 
主因 子 分 解 . 否则 ,返回 到 第 二 步 ， 继 续 进行 主因 子 分 解 迭 代 。 此 时 返回 第 二 步 应 是 利用 第 
七 步 所 求 的 矢量 上 来 计算 了 。 

这 样 计算 出 来 的 + 值 已 失去 正 交 性 质 ,可 以 引入 补充 的 计算 环节 使 之 保持 正 交 .但 这 对 本 
书 所 讨论 的 多 元 校正 的 问题 无 关 紧要 。1: 述 计算 得 到 的 g.v' 应 对 保留 , 供 下 一 步 测试 时 用 。 
如 要 求 在 测试 时 检验 校正 模型 是 否 正 确 ， 则 r,t 也 需 保 留 。 

下 一 步 计算 + 与 1 之 间 的 内 部 美 系 ， 进 行 回归 运算 : 

b=r't/ (tt) 

以 上 计算 过 程 可 示意 地 用 图 6-7 表示 ,值得 指出 的 荐 ,以 上 计算 的 各 分 解 矢量 均 对 应 第 一 
ТЕНЕ, Mr, q ft，v 1， 为 简洁 起 见 ， 在 上 述 过 程 中 下 标 均 瞳 去 。 下 一 步 计 算 残 
Ж: 


Бу оцу! 
Ec = C— riqi =C—btqi 
以 Ey REY, 以 Be 代替 CLR EL EXER E BUE RRR, GARE EB T r а}, 
to w MAPA BRIE By ‚ЖП Ecos 依次 类 推 ， 直 至 找 出 了 和 C 的 全 部 主因 子 为 止 . + 
因子 的 数 日 可 用 交互 校 验 法 或 方差 比较 来 决定 。 


SEPARA, ACAD Е узу 
或 其 量 测 的 矩阵 ?km RUBY —T' VU 的 关 
系 及 在 校正 步 又 中 存储 的 V ， 可 算出 
tem Mat 与 7 的 关系 可 求 出 raw， 由 存 
fiis QU. ВО ска. 

ASR яр, MERER КУЗЕ 
FE. РНИ, EME UR RU 3 
法 是 -- 脉 相通 、 相 互 连 贯 的 ， 从 中 可 以 明 
显 地 看 出 -- 个 逐步 发 展 的 过 程 。P- 失 阵 方 
法 克服 了 天 -矩阵 方法 要 求 两 次 道 而 引起 
误差 扩大 的 缺点 ; 而 主 成 分 回归 则 克服 了 
PAB EAR BR fk ЖОЙ RE BG Bs të A 
BA. ЖАЛЕЛ Y E CE 
阵 ) 以 得 其 广义 逆 而 显著 地 改善 了 P-E 
方法 ; 偏 最 小 二 乘法 则 不 但 立足 于 分 解 了 
AREE. 而 且 还 同时 分 解 C 矩阵 〈 浓 度 校正 
矩阵)， 而 且 在 分 解 了 和 矩阵 时 考虑 C 矩阵 
的 因素 ,在 分 解 C 矩阵 时 考虑 了 SEER EI 
X. 加 强 双方 回归 对 应 计算 的 关系 ,以 求 
获得 最 佳 回归 预测 的 效果 。 
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图 和” PLS 投影 及 内 相关 示意 图 


由 于 主 成 分 回归 与 偏 最 小 二 乘 回归 对 K AB RERO P- 算 阵 方法 给 出 了 显著 性 的 改进 ， 故 在 
近年 来 得 到 了 相当 广泛 的 应 用 ， 而 且 ， 在 方法 本 身 的 理解 和 改进 上 ， 广 大 化 学 计量 学 家 也 进 
行 了 大 量 的 工作 , 其 中 较 著 名 的 有 Hoskuldsson 对 偏 最 小 二 乘法 的 解释 和 说 明 , 他 证 明了 偏 最 
小 二 乘法 本 质 上 是 对 Y'CCY СҮҮС 851877. Маппе 从 算法 的 角度 说 明了 , 相对 于 主 成 
分 回归 的 是 对 了 矩阵 进行 对 角 分 解 , W| PLS 就 由 当 于 对 了 矩阵 进行 双 对 角 分 解 , ri PLS2 就 


相当 于 对 了 和 矩阵 进行 三 对 角 分 解 。 


现 将 多 元 间接 校正 方法 的 计算 公式 分 列 于 表 6-3， 以 更 简洁 的 形式 说 明 它 们 之 间 的 关系 。 


R63 间接 多 元 校正 方法 的 矩阵 计算 比较 


у 


方 法 天- 矩阵 法 PERA 
数学 模型 ¥=KC T C= PY ~ 
校正 K-YC'(co^ P=C YY 
Kaeo) er P= -YC 
预测 сат = (КЮ Ky xen Jin 
Съм KOK Y E 
PCR PLS2 PLSI 
ш y-U's v^ Y=URW Y-URW: 
FV un Y! -WR OD Y*=WR-!U' 
P=cy! P=CY- PY! 
57 :对 角 和 矩阵 县 :二 对 角 矩 阵 R, 二 对 角 矩 阶 
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三 、 通 用 标准 加 入 法 


经 典 分 析 化 学 中 经 常 采 用 标准 加 入 法 ,以 克服 基体 或 底 液 对 分 析 校 正 的 影响 ,事实 Es 标 
准 加 入 的 方法 同 翌 可 推广 到 多 元 校正 的 情况 。 前 两 节 讨 论 的 多 元 线性 回归 和 Kalman 滤波 算 
法 都 是 首先 要 获得 校正 所 需 的 敏感 度 邱 阵 或 是 各 物种 的 标准 谱 , 如 失事 抑 无 法 获得 标准 谱 , 即 
由 于 待 测 样本 的 基体 条 件 不 清楚 时 ， 无 法 找到 标准 谱 的 量 测 条 件 时 ， 即 可 采用 通用 标准 加 入 
法 中 "中 来 进行 多 元 校正 。 

【基本 思路 】 

通用 标准 加 入 法 的 实质 是 在 待 测 多 组 分 体系 中 直接 加 入 多 种 待 测 标准 物 ， 以 构成 一 个 新 
的 量 测 矩 阵 ， 再 从 这 新 的 量 测 矩 阵 求 得 在 此 基体 溶液 中 的 各 标准 物 的 标准 量 浏 谱 ， 继 而 用 求 
得 的 标准 谱 对 待 测 多 组 分 体系 进行 直接 校正 ， 即 可 求 得 此 多 组 分 体系 的 各 组 分 的 浓度 来 。 

【基本 过 程 和 算法 } 

设 有 一 待 测试 样 mn， 其 a 个 组 分 的 浓度 矢量 为 c。， 向 此 试 样 中 进行 m 次 标准 加 入 《未 作 
加 入 的 原始 试 样 认 作 加 入 量 为 零 的 试 样 )， 这 样 可 得 一 新 的 量 测算 阵 了 Y， 有 


Y, = Xp. Car „+ E. (6-46) 
式 中 
Ya Ja Ya Ут! 
Pu Xs Ую CU Ум 
Y=[y ye neo] = >a ya Уз c9 ym! (6 47) 
Doi: qd Ө 
Ji Ya Уз l >") 


ир,» (= 1,2, am) Во КШ АНА ПЕ Vr ET B B S BITS DO Oe RE CREATURE 
在 户 个 分 析 通 道 或 波长 上 进行 的 。-- 般 要 求 mn. FEM REE C 


а 6G а та Ас. Aen Aeg се Асы 
Cr & G се б Агь Ac, Мы + Aeng 

C=C FACS c с, су c es |] Aca Ac Асу ++ Мы; (6-48) 
Ca б б се с Ac. Аш Асы + Асы] 


式 中 ，Ae, 表 示 第 i 次 对 第 7 个 待 测 组 分 加 入 的 浓度 。 注 意 在 加 入 时 ， 必 须 使 原 待 测 样本 的 溶 
液 的 体积 保持 不 变 ( 即 加 入 小 体积 的 较 浓 标准 溶液) 或 采用 稀释 至 相同 体积 的 方法 ,这样 ，Cv 
可 看 成 是 一 个 每 列 相 同 的 矩阵 , MEIRA co 构成 . 式 (6-46) Rg X BE A RAEE. 
它 的 每 一 列 缘 由 体系 中 各 组 分 的 标准 量 测 谱 梅 成 ， 即 


Хи Ха Z=] 
Жи 222 б a | 

X=[xi,x, ox. ] pa. cmo zal (6.49) 
muy amo сб duy) 


WRA уо 来 组 成 一 个 与 7 相同 大 小 的 矩阵 Y,， 即 


to 
a 


Ya Уз Yu yo] 

Уш Ун Y Yos 
Yas [yoy уа Уш Yon ys | 

o Yup Yu Uo Yn) 


Ag Pk Y, 中 包括 m PLATEIS A EE yo WA, 

AY pm 7 Y- Yo КОС TAC ХОС) =X pen Cs (6-50) 
式 (6-50) 中 矩阵 АУ, f АС, i ENEA AUB h ETE BO SI ЖЮ ЖО XK 

X=AYAC'(ACAC') 
GR RHEE 天， 该 体系 的 未 知 浓 度 矢 量 e, 就 可 用 下 式 立即 求 得 
e 7 (XX) OXY, (6-51) 

在 此 值得 提出 的 是 , АС REA TRL E h À ЖЕ m UT A KAR HE A РЕ. ЖОТЭР РЕТ] 
以 由 分 析 者 进行 设计 。 合 理 的 设计 应 当 使 各 次 加 入 的 标准 浓度 线性 无 关 ， 为 此 可 采用 因子 或 
正 交 设计 来 实现 。 


四 、 稳 健 多 元 校正 方法 


在 前 儿 节 的 讨论 中 ,我 们 知道 ， 在 以 上 的 儿 种 多元 校 止 的 模型 中 ， 一 般 都 假设 化 学 的 量 
测 误差 都 是 服从 正 态 分 布 的 等 方差 白 噪声 ,但 是 在 实际 分 析 工 作 中 这 一 假设 不 一 定 满足 。 
Clancey 对 250 次 量 测 包 括 50000 金属 化 学 分 析 的 误差 分 布 进行 调查 的 结果 表明 ， 其 中 只 有 
10% ~ 15.95 RE DUB AGA ЕА 07, 在 对 血样 的 油 查 也 给 出 了 相 类 似 的 结果 :六 。 出 现 这 
样 的 调查 结果 的 原因 可 归结 为 两 个 原因 : D 化 学 量 测 的 误差 本 来 就 不 一 定 服从 正 态 分 布 ; 
O 在 量 测 过 程 中 存在 有 奇异 点 。 所 谓 奇 异 点 是 指 远离 分 布 整体 的 量 测 值 。 产生 奇异 点 的 原因 
很 多 ， 它 可 以 是 过 失 差 错 . 也 可 能 是 样本 点 没有 落 在 实验 设计 的 范围 之 内 ， 也 可 能 就 是 极 少 
数 就 来 自 此 分 布 的 奇异 点 。Barnett Hl Lewis 对 此 作出 了 较 详细 的 讨论 ”稳健 多 元 分 析 的 方 
法 正 是 为 消除 或 减轻 奇异 点 影响 和 直接 对 非 正 态 分 布 数据 进行 解析 而 设计 的 。 

很 多 用 于 化 学 数据 解析 的 方法 都 是 基于 最 小 二 乘 估计 〈LS)， 如 主 成 分 分 析 (PCA)， 多 
元 线性 回归 (MLR) 主 成 分 回归 (PCR; 和 偏 最 小 二 乘 (PLS) 方法 都 属于 此 类 。 然 而 , 最 小 
二 乘 方法 是 不 稳健 的 ， 这 可 能 是 由 其 目标 函数 是 用 残 差 的 平方 和 所 决定 的 : 

Min Si? = Min (у, — ex, — ara, — ашты)? (6-52) 

RP., r 是 第 i APRÉ: y CH 1.2 en OB ARAB: rG—=1,2, n j= 
12,0938 i S RERU A Б Ж jh BERG S 0— 1,2. o 00 j F SRM. 从 
R (6-52) 可 以 看 出 ， 如 某 一 个 量 测 值 y уН, EWRERK, HAP HBR, WF 
最 小 二 乘 估计 将 产生 很 大 影响 。 故 稳健 估计 的 第 一 步 首 先是 由 Edgeworthlss: fg 1887 年 提出 的 
最 小 一 乘 估计 ， 即 


Min |, (6-53) 

然而 ， 最 小 一 乘 估计 只 对 у 的 奇异 点 稳健 ,而 对 另 一 类 奇异 点 ， 亦 称 为 坏 杠 杆 点 的 值 非 
常 敏 感 。 所 谓 杠杆 点 在 回归 分 析 中 称 为 强 影响 点 "”;, 有 关 这 类 奇异 点 的 例子 可 参阅 文献 ,为 
评价 方法 的 稳健 性 ，Hodgese9 引 人 了 崩 省 点 的 概念 这 “概念 的 更 一 般 的 计算 公式 则 由 
Hampelco 给 出 。 一 般 说 来 ， 贿 省 点 的 概念 可 解释 为 强烈 影响 估计 偏离 其 “实际 ”情况 的 最 小 
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的 奇异 点 数 与 估计 时 所 包含 点 数 的 比值 。 最 小 二 乘 估计 的 崩溃 点 是 a 这 就 是 说 . 只 要 在 
个 量 测 点 中 有 一 个 是 奇异 点 ， 它 就 可 以 完全 破坏 最 小 二 乘 估计 . 值得 提出 的 是 ， 如 果 存 在 坏 
杠杆 点 ， 最 小 一 乘 的 骨 省 点 也 是 1291 

在 统计 学 中 ,一 般 用 两 种 方法 来 处 理 含 奇异 点 和 非 正 态 分 布 的 数据 ， 即 诊断 方法 和 稳健 
估计 方法 。 如 Rousseeuw 和 leory З ВОЗЕ ЧО, 这 丙种 方法 昌 处 理 顺 序 完全 相反 , 但 却 殊 途 
同 归 ， 呈 有 相同 日 的 。 诊 断 方法 昆 着 重 于 首先 找 出 奇异 点 ， 在 剔除 这 些 奇 蜡 点 后 继 用 经 典 估 
计 方 法 处 理 ; 而 稳健 估计 方法 则 是 在 解析 过 程 中 找到 数据 分 布 的 主体 , 构造 稳健 估计 模型 , 同 
时 使 数据 中 的 奇 姐 点 不 对 估计 产生 影响 (尽管 这 些 奇异 点 有 很 大 的 夏 差 )。 在 实际 的 应 用 中 
两 种 方法 几 平 产生 同样 的 结果 .选择 哪 种 方法 来 进行 稳健 估计 无 关 紧 要 。 在 这 里 我 们 对 近年 
来 在 统计 学 和 化 学 计 昔 学 中 出 现 的 稳健 方法 进行 讨论 ， 使 起 者 对 多 元 分 析 中 的 稳健 方法 有 一 
全 面 性 了 解 . 

(一 ) 稳健 回归 方法 

稳健 回归 方法 是 稳健 估计 方法 中 一 种 最 常用 的 方法 ， 其 主要 思路 是 在 回归 过 程 中 找到 数 
据 分 布 的 主体 ， 构 造 稳健 回归 估计 模型， 在 进行 仙 计 同时 使 数据 中 的 奇异 点 不 对 估计 产生 影 
响 〈 尽 管 这 些 奇 异 点 有 很 大 的 残 差 )， 则 由 此 而 得 的 估计 古 稳 健 的 。 

1， 基 小 一 乘法 

【基本 思路 ] 

最 小 一 乘法 首先 是 由 Edgeworth E 1887 frd li. REEL b ROS Mine |, BURN RR 
小 二 乘 由 于 对 残 差 进行 平 方 而 增 大 异常 点 对 拟 合 的 影响 ， 从 而 达到 稳健 的 效果 。 由 于 绝对 值 
的 计算 不 便于 微分 ， 最 小 一 乘 很 难得 到 像 最 小 二 乘 那 样 的 简洁 解析 解 ， 一 般 需 采 用 优化 方法 
求解 , 本 文 介绍 的 是 一 种 基于 数论 的 序 贯 全 局 优化 方法 (SLAWE, 该 优化 方法 采用 数 
论 方法 在 搜索 区 间 均 匀 布 点 ， 继 序 贯 收缩 搜索 空间 ， 故 有 序 贯 数论 优化 算法 〈SNTO) 之 称 。 
与 其 他 全 局 优化 算法 比 , SNTO 具有 原理 清晰 明了 , 算法 易于 实现 等 特点 。 当然, 最 小 一 乘法 
也 可 用 线性 规划 的 方法 来 求解 :3 全 ， 读 者 可 参阅 文献 [45]。 

【基本 算法 J 

SNTO 算法 的 第 一 步 就 是 确定 搜索 区 间 , 继 在 搜索 区 间 均 匀 布 点 , 序 贯 收缩 以 达到 最 优点 
的 合计 。 

D 多 元 校正 浓度 估计 的 约束 区 间 

从 化 学 知识 可 知 ， 浓 度 估 计 值 G= 1, n oO КРЗ, МТО 算法 的 搜索 下 界 为 a 一 
(0,…,0), 另 从 式 (6-1)? 和 式 (6-2) 可 知 


уала en de (6 54) 


对 于 任 一 组 分 ,有 


PT e, 


亦 即 
¿S 0.49) 1а Мах[ (у, Ta)/z l Sleen) (6-55) 
if Lares mi 
式 中 , m 为 昌 测 点 数 (波长 数 ), а 为 一 正 数 ， 以 蔡 代 误差 的 作用 ,其 余 符 号 意义 同 前 。 所 以 ， 
多 元 校正 的 搜索 区 间 的 上 界 为 


b=(Max[((y, +4) лаа ]; Max Gio 0/2] 
(2) n 维 实 数 空间 中 的 长 方 体 域 Га, b] 时 的 SNTO 算法 


217 


4 a=(0,--,0),b=(Max[(y 2/2]. Мах Gin р). ДА x= (ruan), 
SNTO 的 过 程 如 下 : 

(D Wek. 4:0, D" D,a" =a AR b" =. 

© 产生 NT-net, 用 glp 集 产生 在 D? =L a B ] EHI A RE n REUS ро, 

G 计算 近似 最 优点 。 确 定 满足 下 式 的 xn cona m MTS 

M9? —obj(x ^) E [| Sobj(a) V x€ p^U i7 Ts 

RH БЕ, xn MORE AAT BIE x` f M 的 最 佳 近似 。 

@ 终止 准则 。 今 AOR — a) /2, WR max (A^ 0920.0 0 — AOR CRUEL FAC 
рощ ял Aik IIT OR MO, 否则 ,执行 下 一 步 。 

© 收缩 搜索 域 。 构 造 新 的 搜索 域 ро [а.в 

а?*? = max G;" — Yer? ,a,) 
H 
bÀ = min (х Yei b) 

ABO ROO BDI T. Фаг. BH. 

方 开 泰 等 建议 选取 n> 二 41 一 … 并 使 用 7 二 0.5。 此 外 .虽然 以 上 算法 是 为 长 方 体 搜索 域 
中 的 优化 间 题 而 设计 的 ， 但 可 很 容易 由 将 它 推广 至 一 般 的 搜索 域 中 。 

2. M 估计 法 

【基本 思路 ] 

M 估计 是 极 大 似 然 估计 的 一 种 简称 1。 其 主要 优 路 也 是 改变 估计 的 日 标 函数 。 反 最 小 一 
乘 估 计 用 残 差 平方 和 为 目标 函数 的 做 法 ， 它 重新 定义 了 一 个 日 标 函数 

Min Det) 

sth, o CO OI BG. 即 оС) =p), He 等于零 时 只 有 唯一 的 最 小 。 对 式 (6-56) 的 
回归 参数 求 导 可 得 


NEW (к/з), -0 (6-56) 
式 中 , 亚 (，) 为 p(，) 的 导 函 数 ;s ERR r, BO CHER AS TER, 式 (6-57) 中 的 两 个 矢 景 的 定义 
AUR once Gu snae ens! ЖР @= 00,0, 7,00. AURIS РО) —1/270 JU M 估计 就 是 经 典 的 
最 小 二 乘 估计 。 
实际 上 ,M 估计 是 直接 从 构造 W 函数 而 不 是 构造 o 函数 出 发 ,不 同 的 M 估计 有 着 不 同 的 
更 基数 。 在 这 里 给 出 一 个 例子 来 加 以 说 明 。Andrewst 定义 了 如 下 的 到 函数: 
sin(z/c) Iz|e (6-57a) 
0 |z|>e (6-57b) 
式 中 ,是 -一 个 截断 参数 。z 可 以 是 残 差 也 可 以 是 残 差 的 晒 数 ,所 以 于 可 以 看 成 是 回归 参数 
a (G— 1,2, HBR SR, ARSE Т ww, 就 可 以 得 到 更。 因此,M 估计 在 实际 的 计算 中 
ETERA, 
【基本 算法 】 
CD 最 小 二 乘 估计 得 到 回归 参数 的 初始 估计 а-су, в, ИТ ЖАГАН 
始 残 差 进行 处 理 , 目 的 在 于 降低 大 残 差 对 下 一 步 对 回归 参数 a0 — 1.2, ,加 ) 佑 计 的 影响 : 
_ 1.5Xmedian(r)xsign(r)  |n|2»1. 5X medien(r,) (6-582) 
ml. r,|< 1. Sx median) (6-58b) 


亚 (z) 一 
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AF median (у) SR BUR 22 h fk EE Ca ТЕЕ ИНЕК. БИН £ RA ЫШ 
估计 即 可 由 式 (6-59) 得 到 。 
oat Aa (6-59) 
式 中 
Aas (ХХ) Хв 
(2》 选 代 过 程 
令 Gof E= WG Ejs) 
式 中 
5% =median( [?? |) 
这 样 ,方程 (6-56) 可 变 为 
УО /srs = gem (6-60) 
将 式 (6-60) 换 成 用 wi? 表示 , 即 得 
TOW /s 00 0 = Te WOM sx, (Cto; y] 
= ErP EO [5/0 st) = ErP out] 
= Ti Cw? Ly, — Car? x, ]) Cole? x, 
= EG Ly, — (а Рук] = ә (6-61) 
解 式 (6-61) 可 得 
VAL Qv» X] LYNCH yy (6-62) 
式 (6-62) 实 际 就 是 加 权 最 小 二 乘 估计 的 解析 解 ， 在 这 里 (4…): 为 一 对 角 和 矩阵 ， 其 对 角 元 素 
BUR BOP (O/H At9)。 所 以 ,在 实际 的 计算 过 程 中 , 就 是 通过 式 (6-57) 得 到 io- 2， 然后 
用 式 (6-62) 得 到 07", 再 求 得 新 的 残 差 以 开始 下 一 轮 迭 代 , 重复 此 迭代 过 程 ， 直至 ae 
ca” 的 差 值 的 模 小 于 某 一 给 定 值 。 表 6-4 给 出 了 一 个 这 样 的 计算 例子 。 从 这 一 例子 可 以 有 到 ， 
M 估计 的 收 化 速度 很 快 .由 式 (6-58a)~(6-59) 定 义 的 初始 残 差 和 初始 回归 参数 估计 就 排除 了 
三 个 奇异 点 的 影响 〈 即 表 6-4 中 的 三 个 用 下 划 线 标明 的 数值 : 1.704, 1.792 和 2. 3722. PERK 
代 过 程 中 ， 第 二 次 迁 代 就 找到 了 还 余下 的 那个 奇异 点 Q1. 006， 其 残 差 在 第 二 次 近代 中 为 


0. 2778) 。 在 第 三 次 的 选 代 过 程 中 ， 它 的 影响 亦 被 消除 。 此 时 除 4 个 奇异 点 外 ， 所 有 的 权 因 子 
w” 都 变 成 了 1。 
表 6-4 M 估计 选 代 过 程 " 
ERKA 第 一 次 第 一 次 Sk 
а а а а а а 
原始 数据 1.338 9.3981 | 0.7033 9. 2088 0.5005 0.400€ 
К n = RE RE RE RE RE 权重 
0. 5266 3.5207 0.6640 0.0833 0.9986 0.0218 0.9998 0.0004 1.000 
0. 6596 2. 6640 0. 8185 0.0985 0.9984 0.0219 0.9999 —0. 0001 1.000 
0. 8001 2. 8185 0. 9766 0.0955 0.9984 | 0.0207 0.9999 —9.0001 1.000 
0. 9399 ). 9766 1.129 0.0842 — 0.9988 0.0175 0.9999 —0.0003 1.000 
1.107 1.129 1.265 0.0675 0.9992 0.0129 1.000 —0. 0001 1.000 
1.183 1.265 1.375 0.0392 0.9997 —0.0012 1.000 0.0004 1.000 
1.268 1.375 1449 0.0068 1.000 —9.107 1.000 一 0.0002 1.000 
1.318 1.449 1.482 0.0286 0.99989 — ' —0.0004 1.000 —0.0004 1.000 
LL 7% DO Pu 0.0004 1000 


Sk 
ARKE 第 一 次 第 二 次 | 第 三 次 
кйш а a a az ^ І ES 
1336 —0.398] — 0.:033 0.2086 | 0.3005 0.2000 
n BA 权重 R% БЕ RE 权重 
1.329 1.482 1.469 0.0683 0.9093 —0.0283 0.9999 0.0001 1.000 
1.299 1.469 1. 409 -0.1037 0. 9982 -0.0361 0. 9998 0.0003 1.000 
1.227 1.409 1.307 —0.1351 0.9970 | --л. 0411 0.9997 0.0002 1.000 
1.122 1.307 1.169 | - 0.1598 0.9958 0.0440 0.9997 0.0003 1.000 
0. 9890 1.169 1.008 | —0.1704 0.9952 | 0.0115 0.0997 5.0000 1.000 
0.8396 1. 009 0. 8370. 70.1732 0. 9950 —6.0428 0.9998 0.0004 1.000 
1.006 0. 8370 0. 6671 0.1513 0.9939 0.2778 0.000 0.3199 0.000 
0, 5378 0. 6671 0. 5100 — 0. 1486 0. 9963 0.0378 0.9998 —0. 0001 1.000 
1.704 0. 5100 0. 3735 1.137 0. 000 1.268 0. 000 1.299 0. 000 
1.792 0. 3735 0.26018 | 1.369 0.000 1.474 0.000 1.800 0.000 
2.372 0. 2618 0.1754 2,071 0. 000 2.151 0. 000 2.171 0.000 
0.1328 0.1754 0.1122 --0.0924 0.9991 0.0139 1.000 0.0002 1.000 
(D BUR HERR «2. 3759, 一 1.4033; 经 修正 后 的 初始 估计 :1, 3358, —0. 3981 SERI 0. 5000, 0. 4000. 


【讨论 】 

在 化 学 计量 学 的 研究 中 ,Philips 和 Eyring 最 早 将 M 估计 用 于 回归 分 析 c?]。 他 们 对 38 2 
至 少 含 10 个 数据 点 以 上 的 教 据 米 估计 一 元 回归 参数 , 即 回归 直线 的 斜率 和 截 距 ,发 现 M 估计 
(RF RE РЫ BB RIEM. Wolters 和 Kateman 应 用 另 一 种 M 估计 方法 通过 
Monte Carlo 模拟 对 不 同 误差 分 布 对 参数 估计 的 影响 作出 了 详细 的 研究 2 。 他 们 的 结论 是 :对 
于 所 含 数据 点 大 于 10 的 数据 ,M 个 计 一 般 都 优 于 最 小 二 乘 估计. 魏 万 之 等 用 Andrews ИТЕ 
数 的 M 估计 来 进行 多 组 分 体系 解析 ”1, 他 们 的 研究 结果 表明 ,如 果 误 差分 布 不 属于 正 态 分 
布 , 则 稳健 估计 明显 优 于 最 小 二 乘 估计 。 ИЖЕ? M 合计 方法 来 处 理 多 元 校正 中 的 
部 分 非 线 性 问题 ,那些 偏离 线性 模型 的 波长 点 就 作为 奇异 点 看 待 ,他 们 的 结果 表明 稳健 方法 对 
消除 部 分 非 线 性 数据 有 显著 效果 。 

3， 最 小 中 位 平方 法 

【基本 思路 】 

一 般 说 来 ， 如 果 存 在 坏 杠 杆 点， 最 小 一 乘 的 崩溃 点 是 1/7, m M 估计 的 崩溃 点 难于 大 于 
30%。 为 了 得 到 具有 高 衣 汝 点 的 稳 键 估计，Rousseeuw 提出 了 最 小 中 位 方差 估计 (LMS), 
它 的 目标 函数 是 


m 


Min median(7?) (6-63) 
3k 6-632 ft median (O RRRA FH HPR. LMS 估计 的 崩溃 点 可 以 达到 50% » 这 是 稳健 
估计 方法 的 可 能 达到 的 最 高 值 . 另 外 ,LMS 估计 对 量 测 值 的 奇异 点 和 高 杠杆 点 都 是 稳健 的 ,这 
MALTS RRO, AT, LMS 估计 的 收敛 速率 较 慢 , 一般 说 来 , LMS 方法 的 计算 时 间 
与 量 测 样本 的 点 数 GO 的 立方 成 正比 。 为 此 ，Steiger 和 Steel 提出 了 一 个 改进 算法 ， 其 计算 
速度 与 (nlg (n))° RER", Massart 等 首次 将 LMS 合计 引入 化 学 计量 学 -99。Rutan 和 Carr 将 
LMS 个 计 与 自 适应 Kalman 滤波 方法 用 于 消除 一 维 数据 的 奇异 点 的 情况 进行 了 比较 。 
Ukkelberg 和 Borgen 为 检 出 奇异 点 基于 LMS 估计 提出 了 一 种 稳健 的 交替 回归 方法 5 。 

【基本 算法 】 
该 算法 与 前 述 的 最 小 一 柔 完 全 一 致 ， 只 需 将 最 小 一 乘 的 目标 函数 Mind |= ! 改 为 
Min median(r?) ГВ]. 
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4. МАЛМЕ ЗЕ 
为 克服 LMS ААО BET k STR ЖУ Ан, Rousseeuw HH T Ro JE EE MERE. АН 
У 


i 
MaD X6... (6-64) 


RP, “Юс, e (D... 

从 式 (6-64) 可 以 看 出 ， 此 法 与 最 小 二 乘 类 似 , 不 同 的 地 方 只 是 LTS 个 计 只 版 了 一 部 分 成 
差 较 小 的 来 进行 回归 UA GDB) 00:0. 4 EO n MER. LTS 估计 的 崩溃 点 也 
可 达到 50%， 但 是 它 的 收敛 速度 明 部 如 快 。 


【基本 算法 了 
^ 
QR EAM RACER LE. RE H r ae Sr ik Min > (2)... Вр у, К 
А, 


5. 稳健 主 成 分 回归 法 

最 近 , 由 Walczak 和 Massart 提出 了 一 个 稳健 主 成 分 回 妇 法 (RPCR), 旨 在 构造 一 种 奇异 
点 的 稳健 检 出 方法 ' 汶 ,他 们 的 方法 主要 基于 椭 球 多 变量 修剪 法 (МУТУ 和 最 小 中 位 方差 估 
H (LMS) Ж, MVT 法 主要 用 于 得 到 一 个 稳健 的 离 差 定 阵 , 和 最 小 中 位 方差 估计 (LMS) Ж, 
MVT 法 主要 用 于 得 到 一 个 稳健 的 离 差 矩 阵 ， 并 在 此 无 奇异 点 干扰 的 离 差 矩阵 上 进行 主 成 分 
分 析 以 检 员 站 秆 阵 的 奇异 点 ,构成 此 稳健 主 成 分 回归 法 的 第 一 步 。 接 着 . 采用 最 小 中 位 方差 
估计 (LMS) 法 所 得 的 标准 化 残 差 来 检 出 量 测 矢量 y 中 的 奇异 值 。 

6， 稳 健 偏 最 小 二 乘法 

偏 最 小 二 乘 佑 计 (PLS) 为 化 学 计量 学 中 一 最 常用 方法 。 最 近 , 由 Wakeling 和 MacFie 将 
其 稳健 化 5 , 他 们 将 PLS 方法 中 的 对 X 和 Y ДРЕНОВО RAR w Me 的 估计 过 程 稳健 化 , 研究 
结果 表明 ， 对 于 了 矩阵 中 的 奇异 点 此 算法 是 有 效 的 。 这 稳健 化 的 代价 是 有 关 荷 载 矢量 w 之 间 
正 交 关 系 难 以 保持 。 此 算法 是 为 对 疏 和 和 矩阵 的 奇异 点 进行 独立 地 消除 而 没 计 的 ,其 中 的 稳 
EERE RMT H Beaton 和 Tukey 提出 的 双 加 权 法 "-。 

(=) BRAK 

诊断 方法 主要 是 研究 那些 对 最 小 二 乘 估计 有 较 大 影响 的 奇异 点 的 特性 ， 旨 在 找到 一 种 作 
图 或 计算 方法 来 直接 将 这 些 奇 异 点 或 强 影响 点 检 出 ， 以 消除 它们 对 回归 参数 估计 的 影响 。 本 
市 将 对 两 类 诊断 方法 ， 即 所 谓 经 典 诊断 方法 和 稳健 诊断 方法 ， 进 行 较 详 细 的 讨论 。 

1， 经 典 诊断 方法 

经 典 诊断 方法 主要 是 基于 一 些 非 稳健 估计 ， 如 最 小 二 乘 估计 模型 和 它 的 残 差 均值 及 协 
方差 矩阵 的 分 析 之 上 。 在 此 我 们 首先 介绍 最 小 二 乘 佑 计 的 投影 帽子 矩阵 ML v 


法 源 出 于 此 。 
在 化 学 计量 学 中 称 为 直接 校正 的 多 元 线性 回归 模型 可 写成 如 下 的 矩阵 形式 
y=Nate (6-65) 
式 中 
Za Ze Ta ot Хы 


x= 
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帽子 短 阵 可 定义 为 

H-XO'X)'X (6-66) 
XU GOGO ТЯН B: 2 B LL EROS ME TOR B£ RED E UT B Pets ERA B 3616 828 op SER GE 
18, BA 


у=Ну= XOCX) Ха (6-67) 
ARER, РАИ REFERE. B 
HH=H 
H-H 
而 且 trace(H)=m 


irace (D) —trace(X OC X)! X 
=trace XX OY X) )— trace Pn) =m 
式 中 ,trace!，) 表 示 矩 阵 的 迹 。 
ATERA EERE PED SEC EHI 
h, = (Н), = (ИН), = Shh) = XGA) = УСЕ) 
= № + > hp (6-68) 


“= 
A (6-68) 说 明 OCA. 
而 Әу,/Әу,—. 
这 说 明 及 可 看 成 是 第 i 个 量 测 值 对 其 预测 值 的 影响 程度 的 一 种 度量 。 这样 ,如 果 A ARA (靠近 
1)， 即 说 明 变量 i 对 最 小 二 乘 估 计 有 很 大 的 影响 。 一 般 说 来 ， 当 如 大 于 它 的 平均 值 n/n) 的 
2 们 或 3 倍 时 ， 可 认为 第 i 个 量 测 值 所 对 应 的 x 是 一 个 强 影 响 或 称 为 杠杆 点 。 

在 统计 学 和 化 学 计量 学 中 ， 马 氏 距 离 是 另 一 个 常用 的 诊断 工具 


MD,—-Gu-3)X€  G,—xY (6-69) 
ARE C EX SEMEN BOXE, MEME xG—1.290 MSR. PEER: 
MD.— in— DG, —1) n] (6 70) 


AX 06-70) 可 以 看 出 ， 马 氏 距 离 与 蛋子 矩阵 有 类 似 功效 , 因 它 梧 身 就 是 AR. 上 述 两 种 诊 
断 方法 对 十 单个 的 奇异 点 或 杜 杆 点 都 有 一 定 作用 ， 但 是 ， 由 于 杠杆 点 共有 很 强 的 相互 掩藏 效 
应 ， 以 致 造成 很 多 假象 而 掩 藤 了 真正 的 奇异 点 和 杠杆 点 。 出 现 这 种 现象 的 理由 可 能 是 帽子 矩 
阵 和 马 氏 距离 都 是 建立 在 不 稳健 的 经 典 协 方差 矩阵 之 上 - 

如 前 所 述 ， 单 独 使 用 帽子 矩阵 和 己 氏 距离 不 足以 找到 在 回归 分 析 中 的 全 部 奇异 点 和 强 影 
响 点 ， 另 一 个 原因 可 能 是 由 于 它们 都 没有 用 到 量 测 矢量 у 的 信息 。 为 了 估价 在 量 测 矢 量 中 第 
i 个 量 测 点 的 影响 ， 似 乎 有 必要 在 进行 回归 分 析 时 比较 包括 第 ;个 量 测 点 或 不 包括 第 ; 个 量 测 
点 时 的 回归 参数 的 结果 ， 这 就 导致 了 Cook РОЗЕ FRR, 

Ср = [0а ali) YM (a—aé)) Ve (6-71) 
在 式 (6-71) 中 , 6 是 a 的 最 小 二 乘 估计 , MONE oc 在 没 包括 第 i 个 量 测 点 时 对 的 最 小 二 
ФАТ. ШЕЖЕ МХХ с=т т Eram) AR (6-71) RB CD 很 大 , 这 
就 说 明 第 i 个 量 测 点 对 回归 参数 的 估计 有 很 大 的 影响 。Cook 的 平方 距离 还 可 推广 到 诊断 多 个 
AR AMS, 


ср) Гаа YM laa) 5 /e (6-72) 
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RP, 工 代表 对 应 于 一 个 量 测 点 子 集 的 标号 , MOBS Bi ДН ИЖ Ж]. AM, 怎样 选择 包括 
了 的 子 集 却 的 三 不 容易 。 很 可 能 有 些 点 在 单独 存在 时 影响 不 大 , 但 如 果 它 们 协同 作用 时 影响 就 
大 了 .这样 ， 各 种 可 能 的 子 集 构成 都 必须 加 以 考虑 才 行 ， 由 此 导致 的 计算 就 会 带 来 实际 的 困 
难 。 可 以 想象 , 如 果 必 须 计 算 所 有 可 能 的 子 集 集 合 ， 即 所 有 的 Се Сре 12 nn /2) RR 
目前 已 有 计算 机 都 难 胜任 的 大 工作 量 任务 .所 以 ,如 何 有 效 地 诊断 多 个 奇异 点 共 作 而 不 受 奇 措 
点 的 掩蔽 效应 影响 的 问题 实际 上 还 是 一 个 未 完全 解决 的 问题 。 

2. 稳健 诊断 方法 

为 了 克服 奇异 点 的 推 项 效应 ,Rousseeuvwe 等 提出 了 一 个 稳健 距离 "1: 

RD = (x,—T(x))C(X) xT) (6-73) 

如 果 将 式 (6-73) GR (6-69) 进行 比较 ， 容 易 发 现 , R (6.73) 与 它 的 主要 差别 在 于 用 
T(x) 和 CCX) 分 别 代 糙 了 其 中 的 不 稳健 的 均值 矢量 + 和 协 方 差 阵 C。 在 这 里 ,T(x) 和 CCX) 为 所 
谓 的 最 小 体积 桶 球 估计 〈MVE)[e] 。 它 们 可 以 通过 下 述 选 代 加 权 过 程 而 得 到 


了 (二 tt (6-74) 
COD Уло (х T G0 G T G0 Trt —1) (6-75) 
在 这 里 的 迭代 权重 因子 w dh BI ME АЙЕ. 
iet RD 
o ”其 他 


式 中 ，*e 为 一 截断 值 ， 可 采用 Xaos 

Rousseeuw SABHA. SOR) Py Sib (1.MS) 以 同时 检 出 存 不 和 了 中 的 
奇异 点 。 然 而 Cook 和 Hawkins's1 指 出 这 一 过 程 有 可 能 过 量 检 出 奇异 值 . 算法 参数 的 很 小 变 
化 ,有 时 却 能 显著 地 改变 稳健 距离 的 检 出 结果 。 最 近 ，Atkinson 和 Mulira 提出 一 种 新 的 稳健 
诊断 方法 ， 即 所 谓 的 “钟乳石 图 ”来 消除 多 变量 奇异 点 “。 他 们 不 改变 马 氏 距离 中 的 均 信和 和 
协 方差 阵 ， 而 是 采用 逐步 扩大 计算 子 集 并 逐步 别 除 奇 措 点 的 方法 来 克服 多 个 奇异 点 的 掩蔽 

在 化 学 计量 学 中 ，Naes 提出 了 一 个 为 主 成 分 回归 (PCR) 检 出 杠杆 点 或 强 影响 点 的 诊断 
97619, Hu 和 Massart 比较 研究 了 几 种 稳健 方法 ， 如 单个 中 位 数 法 ， 重 复 中 位 数 法 ， 最 小 中 
位 方差 估计 法 (LMS) 和 模 类 校正 方法 的 检 出 奇异 点 的 能 力 "1。 他 们 的 结论 是 : 在 有 奇异 点 
存在 的 情况 下 ， 最 小 二 乘 估计 难 子 获得 正确 结果 ， 而 稳健 方法 和 模糊 校正 方法 的 估计 结果 一 
般 是 可 接受 的 。 最 近 ， 陈 文 烛 等 提出 一 种 基于 所 谓 的 “钟乳石 图 ”算法 基础 的 稳健 诊断 的 新 
算法 ， 可 用 于 多 个 样本 量 测 矢量 的 奇异 点 的 同时 检 出 。 在 有 可 异 点 存在 的 情况 下 明显 优 子 最 
DZRH, 

(=) 降 维 处 理 的 稳健 方法 

降 维 处 理 方法 是 化 学 计量 学 中 的 一 个 常用 的 分 析 方法 ， 它 可 将 化 学 量 测 中 得 到 的 高 维 数 
据 转变 成 为 易于 观察 的 低 维 数据 ， 在 多 元 校正 与 分 辨 及 模式 识别 中 得 到 了 广泛 的 应 用 。 在 这 
里 将 对 近年 来 出 现 的 一 些 稳健 降 维 方法 作出 简要 的 介绍 。 

1. 投影 寻 踪 法 

如 果 一 个 化 学 重 测 的 m 维 数据 可 看 成 是 mn 维 空间 的 一 个 点 , 则 一 组 这 样 的 化 学 量 测 数据 
可 看 成 是 m 维 空间 的 一 簇 点 云 。 降 维 处 理 技术 的 目的 就 是 要 找到 一 种 方法 ,以 将 这 些 高 维 数 
据点 在 低 维 空间 中 描述 出 来 而 尽 最 做 到 不 改变 这 些 高 维 点 云 的 基本 结构 。 近 年 来 在 多 元 统计 
研究 中 发 展 起 来 的 投影 寻 踪 法 (РР) 就 是 这 样 一 种 降 维 技术 。 它 首先 定义 一 种 投影 指标 ， 然 
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т, ЖЕЖ ВВА, RAR IRE X. T ЖИЕ q Ez ik. 
Huber 对 PP ЭЗЕР Y ARTIS РЕЙ”! Friedman 和 Stuctzle 则 将 PP 技术 加 以 拓 广 ， 提 出 了 
投影 寻 算 回归 "9 ， 投 影 寻 距 分 类 "5 和 投影 寻 踪 密度 估计 。 

Xe E. 化 学 计量 学 中 常用 的 主 成 分 分 析 PCA 本 身 就 是 一 种 特殊 的 PP 过 程 。 如 把 化 
学 量 测 短 阵 下 看 成 是 包括 ?个 严 维 数 据点 的 点 集 ， 即 量 测 矩 阵 王 中 每 一 个 行 矢量 {z, 一 (zi 
одн Za) i= 1.2, nn ) Ж BRE — CUR JA ic LAE Е X. 的 协 方差 阵 为 VY, 有 了 一 
XX. Rl A Ans An 表 示 协 方差 阵 V 的 特征 值 , 则 第 -- 主 成 分 轴 а, ЖУ Je E OG PE X 向 
影 所 得 的 方差 最 大 的 方向 , 即 


А —Max(ajV4) = Мах(а XXa) |a, || =1 (6-76a) 
A-—Max(GVa) =Max(aiX'Xa;) |a, | =1 — (Giles (6-76b) 
如 一 Max (a,Va,) =Max(a,X'Xa,,) | a, | =1 (a, a sau (6-76) 


实际 上 , aoa, sawn} 就 是 协 方差 阵 V 的 对 应 于 特征 值 和 (Gi 二 1,2,…,m) 的 特征 矢量 。 另 一 方 
面 ， 如 果 协 方差 阵 V 的 主 成 分 已 知 ， 则 协 方差 阵 V 可 以 由 主 成 分 重 构 : 
у= Aaa, (6-77) 
从 (5-76) E (6-77) 式 可 以 看 出 ， 经 典 主 成 分 分 析 因 采用 最 大 方差 为 其 投影 指标 ， 故 对 
奇异 值 很 敏感 ， 所 以 它 是 不 稳健 的 。 这 暗示 如 果 选 择 稳健 的 投影 指标 ， 就 有 可 能 得 到 稳健 主 
成 分 分 析 。 有 趣 的 是 在 稳健 回归 与 投影 寻 踪 存在 着 密切 关系 "1, 正如 Roosseeuw 评论 的 那样 ， 
用 投影 寻 踪 来 构造 高 衣 溃 点 的 稳健 方法 是 在 人 意料 之 中 的 
2. 稳健 主 成 分 分 析 和 稳健 奇异 值 分 解法 
李 国 英 和 陈 忠 链 提出 了 一 种 基于 投影 寻 踪 的 稳健 主 成 分 分 析 算 法 ,他 们 将 Huber fJ M ti 
计 的 分 散 度 作为 投影 指标 "9. 谢 玉 瑰 等 也 提出 了 一 个 基于 投影 寻 踪 和 模拟 退火 技术 的 稳健 主 
成 分 分 析 算 法 ,最 小 中 位 矢量 作为 其 投影 指标 ""1。 计算 机 的 数值 模拟 结果 显示 出 此 稳健 主 成 
分 分 析 方 法 对 非 正 态 分 布 数据 和 奇异 值 上 共有 很 强 的 抵御 能 力 。 同样 是 基于 投影 寻 踪 ， 
Ammann-ma 提 出 了 一 种 新 的 稳健 奇异 值 分 解 方法 (RSVD) .此 方法 由 两 步 迭 代 过 程 所 构成 : 
对 数据 矩阵 进行 最 小 二 乘 回 归 拟 合 ， 继 而 将 其 向 回归 超 平面 进行 旋转 ; 加 通 过 稳健 的 广义 M 
估计 得 到 协 方差 矩阵 的 特征 值 和 特征 矢量 从 而 找到 描述 该 数据 阵 的 稳健 协 方差 阵 和 期 望 值 。 
此 稳健 奇异 值 分 解 方法 (RSYD) 可 以 成 为 很 多 多 元 分 析 方 法 的 基础 ,如 稳健 多 元 回归 , 稳健 
多 元 判别 分 析 和 主 成 分 分 析 等 。 
近年 来 ， 在 统计 学 和 化 学 计量 学 的 研究 中 ， 稳 健 方法 的 研究 受到 日 益 重视 ， 并 取得 了 显 
着 成 果 。 其 发 展 的 动因 主要 来 自 对 科学 和 工业 研究 的 实际 数据 解析 的 需 帝 ， 实 因 在 实际 数据 
中 ,奇异 值 和 非 正 态 数据 经 常 遇 到 ， 而 量 测 数 据 的 正 态 性 却 又 经 常 是 很 多 现存 多 元 分 析 方法 
的 数学 假设 基础 , 这 就 使 结果 的 可 靠 性 受到 影响 。 为 克服 这 种 假设 与 实际 存在 差异 的 矛盾 , 稳 
健 方法 就 应 运 产生 ， 面 且 特别 是 近年 来 得 到 飞速 发 展 。 化 学 计量 学 家 们 应 跟 上 这 一 形势 的 发 
展 ， 重 视 稳健 方法 的 研究 和 在 化 学 数据 解析 中 的 实际 应 用 ， 特 别 地 ， 对 适合 于 化 学 数据 特征 
的 新 的 化 学 计量 学 稳健 方法 的 研究 应 该 得 到 应 有 的 重视 。 


五 、 非 线性 体系 的 校正 方法 


在 分 析 化 学 和 中， 一般 都 是 假设 被 研究 体系 为 线性 加 合体 系 ， 如 在 光谱 分 析 中 就 是 要 服从 
Lambert-Beer 定律 , 这 样 就 可 用 前 述 的 多 元 校正 法 , 即 直接 校正 法 、 间接 校正 法 和 广义 标准 加 
人 法 来 进行 校正 ， 一 般 说 来 ,都 可 得 到 汉 意 的 结果 , 只 要 体系 确实 是 线性 加 合体 系 。 然 面 , 作 
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为 一 般 分 析 工作 者 都 知道 ,Lambert-leer 定律 是 有 条 件 的 ,其 中 最 重要 的 一 个 条 件 就 是 亡 有 一 
个 浓度 适应 范围 , 超出 这 一 浓度 适应 范围 , Lambert-Beer 定律 就 不 成 立 了 。 另 外, 在 波谱 量 测 
中 还 经 常 出 现 部 分 非 线性 的 情况 ， 即 在 有 些 波长 点 出 现 不 符合 线性 加 合 性 。 这 就 向 化 学 工作 
者 提出 了 新 闻 题 ， 即 怎样 进行 非 线性 多 元 校正 的 问题 。 对 于 部 分 非 线 性 问题 ， 一 般 可 以 采用 
前 节 所 讨论 的 稳健 方法 来 进行 校正 ， 把 那些 非 线性 的 量 测 点 看 成 是 异常 值 处 理 ， 但 是 一 般 要 
求 这 样 的 非 线性 量 测 点 不 超过 50%。 在 分 析 化 学 中 还 存在 着 很 多 的 非 线性 现象 ， 而且 ， 对 于 
这 些 非 线性 的 体系 一 般 还 很 难 找到 适当 的 数学 模型 ， 是 不 是 还 存在 着 一 种 方法 可 对 一 般 非 线 
性 体系 进行 多 元 校正 。 近年 来 , 对 于 非 线性 多 元 校正 成 了 分 析 化 学 计量 学 研究 的 一 个 热点 .出 
现 了 不 少 的 非 线性 校正 方法 ， 如 非 线性 偏 最 小 二 乘法 等 。 这 些 方法 大 都 是 在 线性 模型 里 引进 
非 线性 项 ， 以 补偿 体系 中 的 非 线性 ， 在 此 不 详细 介绍 ， 恋 者 可 参阅 文献 [79j， 这 里 主要 介绍 
人 工 神经 网 络 法 。 

人 工 神经 网 络 是 从 20 世纪 50 年 代 末 、60 年 代 初 开始 的 , 代表 性 工作 是 Rosenblattd 的 感 
知 器 (peteeptton) 和 Widrow 的 自 适应 线性 元 Cadalnei) t, $4 B 30 余年 历史 .特别 是 20 itt 
£g 80 年 代 以 来 , 以 Hopfield 等 人 半 罗 的 联想 记忆 网 络 模型 、 制 约 优化 网 络 模型 .umelhart 等 
人 :59 的 多 层 前 传 网 络 误差 反 传 算法 (BP 算法 ) 等 为 代表 的 一 批 优 秀 工作 的 出 现 , METAL 
神经 网 络 研究 的 热潮 。 因 人 工 神经 网 络 具有 很 强 的 非 线性 映照 能 力 而 受到 化 学 计量 学 家 们 的 
普遍 关注 ， 是 目前 一 个 发 展 很 快 的 化 学 计量 学 研究 领域 。 本 节 只 对 人 工 神经 网 络 的 基本 概念 
及 多 层 前 传 网 络 误差 反 传 算法 (ВР 算法 ) 作出 介绍 ， 以 期 读者 对 其 有 一 个 初步 认识 。 

【基本 思路 】 

人 工 神 经 网 络 的 基本 已 路 是 基于 人 脑 细 胞 
(神经 元 ) 的 工作 原理 来 模拟 人 类 思维 方式 , 以 建 
立 模 型 来 进行 分 类 与 预测 的 。 图 6-8 GO 给 出 了 一 
个 神经 元 的 示意 图 ,从 图 6-8 中 可 以 看 到 , 神经 元 
通过 神经 纤维 或 突 触 与 别 的 神经 元 相 联 系 ， 用 以 
接受 来 自 别 的 神经 元 的 信息 ， 并 将 信息 继续 传 给 
别 的 神经 元 。 一 个 典型 的 神经 元 可 与 10 Bü Ж) 
神经 元 相连 ， 所 以 人 的 大 脑 是 一 个 相当 复杂 的 系 
统 .实际 上 ,人 工 神经 网 络 方法 只 是 简单 地 借用 神 
经 元 来 表示 一 个 计算 单元 [参见 图 6-8 00]. Е 
也 可 以 像 神经 元 一 样 通过 网 络 与 别 的 计算 单元 相 
й. ПЕШИЕ ШАЯНЫ. 

Hoo 示 出 了 一 个 典型 的 基于 误差 反 传 算法 
的 三 层 前 传 网 络 , 从 下 至 上 分 别称 之 为 输 人 层 . 隐 
蔽 层 和 输出 层 . 在 人 工 神经 网 络 的 计算 中 ,输入 层 
一 般 表示 为 了 它 的 每 一 个 计算 单元 将 代表 了 中 的 
一 个 元 素 , 它们 通过 第 一 层 连接 权重 am dist (6- 

图 6-8 真实 神经 元 示意 图 (a》 与 78) 与 隐 项 层 的 计算 单元 у; 相连 接 ， 
人 工 神经 网 络 的 计算 单元 b) P= fCSho Du D (6-78) 
式 中 ,F(，) 称 为 活性 函数 ， 一 般 可 以 取 以 下 几 种 形式 ， 
QD fGO=sgnGa) =f, COS BR. 4 и 为 正 数 时 , 取 1, 否 则 取 一 1, 此 函数 用 于 处 理 模式 
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识别 时 很 有 用 。 

Q Ла) = +e) -f( :型 非 线性 函数 ,其 输出 值 介 于 0 一 1 之 间 , 进 行 非 线性 校 
正 或 预测 时 很 有 用 。 

@ fra)=tanh(u) — ЧЕНЕ CIE SE eR BC HEt — 1 之 间 , 对 模式 识别 和 非 线性 
回归 或 项 测 都 可 用 。 

另外 ,ww 称 为 第 一 层 权重 偏 暂 点 ,根据 不 同 的 情况 可 取 不 同 的 值 .隐蔽 层 y" 以 同样 的 方 
式 ,也 是 通过 连接 权重 来 与 输出 层 0 相连 。 

所 以 ,整个 3 层 前 传人 工 神经 网 络 可 以 由 下 式 表 出 : 

О, = fOXwig yr + ш) 

= РО (J Owl, + wm) + жй) (6-79) 
式 中 ,ww 好 表示 第 二 层 的 连接 权重 ,而 oP RAB 
一 层 的 连接 权重 。 从 式 (6-79) 可 以 看 出 ,3 层 前 传 
人 工 神经 网 络 实际 是 通过 一 个 相当 复杂 的 非 线 
性 函数 将 输入 矢 量 工 与 输出 矢量 O 连 在 一 起 。 实 
际 上 ,这 样 的 前 传神 经 网 络 还 可 以 是 多 于 3 ES 
亦 即 4 层 或 5 层 的 ,其 结构 可 顺 此 类 推 。 从 此 式 
还 可 以 看 出 ,前 传神 经 网 络 的 确定 实质 上 就 是 连 
接 权 重 的 确定 , 因 在 此 式 中 ,7(，)、1 和 0 都 是 
可 预先 确定 的 ， 只 要 权重 确定 以 后 , 整个 网 络 也 
就 唯一 确定 了 。 

大 们 对 多 层 前 传 网 络 解析 能 力 的 认识 首先 
来 源 于 大 量 的 模拟 实验 和 工程 实践 的 感性 认识 。 
在 应 用 多 层 前 传 网 络 解 决 模式 识别 问题 的 研究 
中 ，Lippmann 通过 大 量 的 仿真 实验 得 出 结论 "1; 采 用 3 层 网 络 可 以 形成 若干 个 复杂 的 决策 
域 ;而 采用 4 层 网 络 则 可 以 形成 任意 复杂 的 决策 域 。 Wieland 和 Leigh:on 则 通过 一 个 具体 的 例 
子 说 明 3 AMER ARES RRB TTS AOA. Ak. KRHA ЖЕ 
ВАЖЕЛА, EN РИН E] ERA EE ER ER R0 8E 77 

为 了 建立 人 工 神经 网 络 模型 , 亦 即 确定 连接 权重 ,Rumelhart 等 人 “提出 了 多 层 前 传 网 络 
误差 反 传 算法 GBP 算法 )。 也 正 是 这 一 算法 的 提出 , 使 得 人 工 网 络 的 研究 又 形成 了 一 个 热潮 。 
这 一 算法 在 模式 识别 及 非 线 性 回归 方面 得 到 了 非常 广泛 的 应 用 。 所 谓 误差 反 传 的 基本 思路 就 
是 定义 一 个 误差 函数 作为 训练 网 络 的 目标 函数 ， 然 后 采用 一 种 方法 根据 误差 反馈 过 来 的 情况 
以 调节 网 络 的 连接 权重 ， 从 而 达到 优化 目的 。 一 般 来 说 ， 都 是 采用 最 小 二 乘 函 赦 来 作为 目标 
函数 ， 即 使 式 (6-80) ЛМЕ 


图 6-9 3 层 前 传人 工 神经 网 络 示意 图 


E = 1/2(2(O, — E (6-80) 
дүр, B= 1,9.) eB ID. RR PK. 
【基本 算法 】 
BP 算法 将 由 以 下 儿 步 构成 : 
O 数据 预 处 理 。 因 为 一 般 大 都 采用 由 * 型 非 线性 函数 为 其 活性 函数 ， 即 Goo Or 
e*)-!。 因 其 输出 值 都 介 于 0~1 之 间 ， 所 以 一 般 都 需要 对 网 络 的 输出 的 数值 进行 颅 处理， 使 
之 同样 落 人 0—1 之 间 。 注 意 到 这 样 的 预 处 理 不 会 影响 问题 的 一 般 性 。 
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O 随机 选取 网 络 之 间 的 连接 权重 ap HI ep Gm Danni en makm dee L), И» 
为 输入 矢量 的 节点 数 或 称 输入 矢量 的 维 数 ); т WAR DORR WAR. - 般 就 用 
《一 0, 5~0, 5) 的 均匀 分 布 的 随机 函数 产生 。 

@he=1, ++, A, 重复 迭代 进行 以 下 步 双 ,直至 收敛 。 

D 前 传 计算 ， 按 照 

эт = FOL + wr) (6-81) 


O, = Уату" + 
= f (Swe FOF — wh») + owe) (6-82) 
来 计算 0， 并 与 所 期 望 得 到 的 数值 比较 ， 计 算出 误差 函数 。 
2) 反 传阅 节 : 计算 出 的 月 标 函 数 对 连接 权 重 的 一 阶 导数 ， 并 以 此 来 调节 连接 权重 wrt 
wry。( 因 在 此 只 介绍 最 陡 梯度 法 ， 所 以 用 的 是 一 阶 导数 ， 别 的 优化 算法 奖 样 是 可 行 的 )。 
dw, = pau, (6-83) 
Ap, p 为 一 步 长 因子 ,可 在 《0~1) 之 间 取 值 ; «为 第 ALANE, MARRE 
жазай, BAMET (uid cio fcire) SEN f 
不 同 层 , 它 有 不 网 表达 式 ， 


КЕ [Gs BGI 92 DEL DR (6-842) 
| орди) а УА (6-84b) 
RH, a(1—s)=u, 
因 w= (Уши РО) 1н 5) (6-85) 
所 以 有 


а Ра) SUL te )/dz=—(1+e *) (7067 1) 
= (ае) A/A te =u a) (6-86) 
式 (6-83) 中 的 消长 因子 的 取 值 大 
小 对 收敛 速度 有 很 大 的 影响 ， 如 果 取 值 
AA, WR RARER HRB: К 
之 ， ÉBBUECK W 2 q 3 RM PHS 
代 过 程 收 仇 太 慢 .一 般 说 来 ,为 了 加 快 达 
КНЕ ЮЕ. 
ER (6-83) 中 引 人 和 人 一 个 惯量 因子 4 
Awy tat 1) = pou Ади, (а) 


荧光 强度 


(6-87) 
E 330 540 550 560 570 580 590 600 610 以 保证 选 代 收 和合 速度 。 
荧光 波长 /nm sa 
图 6-10 “三 组 分 非 线性 奖 光 分 析 体系 荧光 光谱 图 因为 人 工 神经 网 络 具 有 很 强 的 非 线 


1 一 三 组 分 混合 体系 实测 荧光 强度 曲线 : 2,3,4 分 别 为 性 映照 能 力 ， 可 在 非 线性 多 元 校正 中 取 
PAB ТУРИЙ В, MI B 单 组 分 实测 荧光 强度 曲线 ”得 重要 作用 ， 是 一 个 值得 重视 的 非 线 性 

5 一 将 有 曲线 2,3,4 接线 狂 加 合计 算 所 得 的 曲线 ERE WHR. BOR PARR 

光 灼 灭 现 象 ， 多 组 分 混合 时 存在 着 非 线性 ， 而 且 其 数学 模型 不 清楚 ， 从 而 为 荧光 分 析 的 多 元 


227 


校正 带 来 困难 。 对 一 个 含 罗丹 明 B、 丁 基 罗 丹 明 BARH B 的 三 组 分 荧光 混合 体系 进行 了 调 


жи0, AE RP 
最 小 二 乘 (PLS) 对 


阅 文 献 L[88，89] 。 


图 6-10, 从 图 6-10 可 以 看 出 , 此 三 组 分 体系 的 确 存在 严重 非 
KA) fs BUR TR 6-5， 说 明 PLS 不 具有 很 好 的 预测 能 力 ， 这 是 因为 
PLS 实质 上 还 是 一 种 基于 线性 的 数学 模型 ， 而 采用 


误差 反 传 的 前 向 三 层 的 人 
进行 分 析 的 结果 却 是 令 人 满意 的 ,结果 示 于 表 6-6. 将 人 工 神经 网 络 用 于 化 学 研究 


mes PLS 对 试 样 各 组 分 浓度 预测 的 相对 误差 OO 


线性 ,用 偏 


工 神经 网 络 
的 例子 可 参 


试 样 编号 | SHAB | TX PHM 5 EE. B 试 样 编号 | PAB TSAAR EIB 
г 1.841 12. 809 14. 652 yo] 8.286 —23.076 | —28.202 
z 1.866 1.514 — 6. 683 18 0.660 675 —1. 278 
3 2.611 22. 768 19 8.076 | —0.221 | 2.668 
4 31. 952 42. 056 20 2.868 = 11.733 . —18.747 
5 0, 839 ET m | 8277 一 23.468 | 一 24.575 
6 ! 4.502 3. 898 2201 —22.460 0.386 4.781 
? | 1.580 | 1.759 23 = 17.494 21. 628 — £6. 986 
8 10.271 7. 899 21.602 | 一 14.432 -16.97% 
9 1.281 т.538 DES 9.258 10.737 
10 4.587 18.773 2.345 11.987 10. 670 
11 —58. 106 — 26. 017 — 44.797 27 10. 335 7.050 14.199 
12 0. 500 ! —13. 927 一 11. 580 28 4.557 3.902 3.219 
13 一 042 | —0099 6.747 29 13.466 6.116 12.01 
14 -3)t314 3.130 —6.833 3 815 PETI 14. 686 
15 45.184 36.420 29.213 | 绝对 值 平均 | — 12.871 10.247 11.058 
16 = 28. 326 —5.288 | 6770 l 

表 6-6 BP-ANN ЖЕНЕ 2 ЖИ ЖО S B SHE SR MORES 
[ ТЕГЕ Т ТЕТЕ | вав 
试 样 编号 uy m Nm wow v сз m "m 
gt mi? |g + т] 2 age ml-! | ag mi~? pgs ml? | yg + ml“? 

1 E 030 1213 | 1892 | 1.832 —3.16¢ | sen 

z .119 | --7.392 | 2648 | 2.618 ciae | 5.598 | 

3 -187 -4488 | 1,892 | 1.906 0.785 ^ 6344 | 

4 17 2.4 | 2648 | 2.650 0.03 | 6.717 | 

5 93] | —211 | $405 | 3.494 2.618 | 7.090 

6 .518 4.449 | 3.027 | 2,957 2.311 | 7-464 

了 . 105 —0. 287 3.405 3.308 | .947 9. 703. 

8 - 620 —5. 041 4.162 1.115 1.133 10. 822 

9 486 10.119 | 3.784 3.695 2.346 | 10.76 | 

10 171 $902 | 5.297 | 5.116 —3.420 | 9.330 

11 .088 | —7.914 | 113 | 1,603 5.951 | 3.732 

12 „з | 1.290 | 3.027 | x06] 1 1.126 | 10.678 

18 119 374 | 1802 | 1.270 —6.446 | 5.224 

14 ‚988 5.262 | 2.270 | 2.147 —5.196 | 4.478 

15 . 497 0.050 1.513 10.18 4.105 

16 .224 opsi | 1.892 一 3.695 | 4.478 

17 2.038 8.890 | 3.027 1.534 | 4.861 

18 659 10.82 | 2,648 2.644 | 4.478 | 5.997 11-82 
19 ‚512 9.592 | 4.162 | —0.917 | 11.198 | 11.379 | 168 
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Er 
i ETT I TER B m B 
me gs ГИР | "E 
“ "| мый о" e С! Sl at 
pgs ml {pg + ml? pg ml serm gsm: 
2 [ *743 3788 3.530 | 3.784 | 3.691 4.836 | 11.569 | 11.875 © - 1.602 
21 2.994 | 3.214 7.345 | 5678 1 5217 -8.072 | 1.942 | 17772 | —1.380 
ze [вн | 5169 | -7.99 sam 4.700 3.518 11.569 | 10.963 5.237 
23 3.368 | 3.442 2.486 | 4.162 , 4.245 1.995 | 11.198 | 10.708 | = 4.357 
n вай | 4.339 | —3x38 | $207 | 5.271 -0.487 | 1L912 | її | -1.770 
So | nns | 3.308 | -e268 | atez | ош -1.523 | 7464 | 6.978 6.499 
2 | sasi | eise | -raza | nee | zs | — ss | sass | sor | вон 
27 3.743 | 3,954 ssas | sor | mae вооа | nasr | т.008 | osos 
28 | 4117 | 4.135 0.449 3.784 | $745 | -L913 | 9.330 | 9.740 | 1.403 
29 ' 2.620 | 2.798 6802 xao | won mesz | таб | тїт | —4.378 
30 4491 | 4.679 aam | ares | sco -1-425 | sgo | 9078 | 1037 
平均 4.698 | | 3.418 1 3.685 
L co 为 组 分 实际 浓度 ; co 为 组 分 预测 浓度 ;ee 为 未 知 集 浓度 预测 相对 误差 . 
尽管 人 工 神经 网 络 的 研究 已 取得 令 人 兴奋 的 进展 ， 但 是 ， 益 的 说 来 对 它 的 研究 无 论 在 理 
论 还 是 应 用 上 都 还 处 于 初期 阶段 ， 还 存在 很 多 问题 值得 探讨 ， 如 网 络 训练 速度 、 过 拟 合 、 
局 寻 优 、 网 络 结构 与 网 络 能 力 等 问题 都 存在 未 知 因素 ， 值 得 进 -- 步 研究 。 有 兴趣 的 读者 可 参 


阅 文 献 [90~93]。 
六 、 病 态 体 系 和 有 偏 估计 方法 


在 由 式 (6-1) 所 表述 的 直接 多 元 校正 的 模型 中 ,x.(1 二 1,2,…,n) 为 纯 物 质 的 量 测 矢量 
(三 为 纯 光 谱 ， 或 为 其 他 纯 物质 谱 )， 注 意 到 在 此 模型 中 还 隐 含 着 一 个 假设 ， 即 不 同 的 化 学 物 
质 的 量 测 谱 是 不 同 的 , 用 数学 语言 来 说 , ЖЕ x 0— 1.2, o0 BREMEN, EH 
X DAR TRE. 可 是 ,在 分 析 化 学 的 实际 中 往往 存在 着 这 样 的 情况 ,在 某 些 光谱 (如 
最 常用 的 紫外 可 见 谱 ) 的 量 测 中 ， 有 些 不 同 的 化 学 物质 (如 某 些 异 构 体 ) 却 具 有 很 相似 的 光 
iÉ. 虽然 它们 的 光谱 多 少 有 的 不 同 , 但 却 非常 相似 ， 这 就 会 使 校正 矩阵 了 接近 坊 秩 ,而 使 满 
秩 条 件 很 难保 证 ， 或 者 说 纯 物质 谱 之 间 的 差别 已 与 量 测 误差 相近 ， 这 样 的 情况 在 数学 上 称 之 
为 病态 。 由 于 校正 矩阵 接近 亏 秩 ， 亦 即 存在 着 共 线 性 关系 ， 在 常用 最 小 二 乘 的 求 逆 时 将 带 
来 很 大 误差 , 而 使 由 此 佑 计 出 来 的 相对 浓度 6G — 1.2 o0 不 可 靠 。 为 了 解决 由 矩阵 下 接近 
亏 秩 而 带 来 的 问题 ， 近 年 来 统计 学 家 们 提出 了 所 谓 的 有 偏 估 计 方 法 ， 其 中 最 著名 的 是 岭 回 归 
方法 。 在 本 节 中 ， 将 对 岭 回归 方法 作出 介绍 ， 并 讨论 用 岭 同 归 可 在 什么 程度 上 来 改善 病态 体 
系 的 相对 浓度 估计 。 

与 最 小 一 乘 估计 不 同 ， 岭 回归 是 一 种 有 偏 统计 回归 算法 ， 其 基本 公式 为 

c(A)=(XX+AD ху (6-88) 
式 中 ,于 的 意义 同 前 , НАНЕ PE у 为 混合 物 的 量 测 矢量 ; (为 混合物 的 浓度 估计 矢 
3 DS Xn) 阶 单位 矩阵 ; 上 为 可 调 参 数 。 由 于 上 的 引 人 ， 上 岭 回归 失去 了 最 小 二 乘 回归 所 
具有 的 无 偏 估计 的 特点 ， 故 称 为 有 情 估 计 。 

岭 回 归 与 经 典 最 小 二 乘 回归 本 质 不 同 点 在 于 它 不 是 以 Cy co (y у), ЖЭ УЖ 
最 小 为 其 目标 ， 而 是 使 (e 一 cc 一 c)， 即 估计 参数 趋 于 最 小 ， 而 这 却 正 是 分 析 : 工 作 的 目的 。 
对 于 最 小 二 乘 估计 参数 的 估计 准确 度 ， 可 由 估计 值 均 方差 标准 (MSE 给 出 : 
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MSE) = E(Ge—e Get Et ll ее ||? 

式 中 ,至 {，} 表 示 数 学 期 望 ,从 MSE WEFO PAX) =PO ‘=F D/A A, 
MSE—c6 YA o! 其 中 为 量 测 误差 之 方差 ,入 为 XD 的 第 i 个 特征 值 , 这 一 关系 说 明 , 最 小 
二 乘 估 计 的 均 方差 由 决定 ， 其 中 特别 是 由 最 小 的 特征 值 所 决定 。 当 组 分 纯 光 谱 (或 称 纯 物 
种 量 测 谱 ) 的 相似 程度 ， 也 就 是 我 们 常 说 的 重要 径 度 很 严重 时 ， 即 校 止 抵 阵 中 存在 共 线 性 关 
系 时 ， 校 正 抢 阵 协 差 阵 的 特征 值 的 最 小 值 就 会 很 小 ,此 时 体系 处 于 “病态 ”情况 ， 由 最 小 二 
乘 估计 出 的 “的 均 方差 就 会 很 大 。 而 对 于 岭 回 归 有 

MSE) =0 D1/(k--A) (6-89) 
从 而 使 估计 值 的 均 方差 减 小 以 致 准确 度 提高 。 具体 地 说 , TT BR IE} (0, 使 得 (6 的 
均 方 差 比 < 的 小 , 即 


Ell ek) ei] «Et e—e | 

EF £ ийе, AT OR, ШИБЕ (6-88), A cD е RE. ЖЕР" 
给 出 了 一 个 简易 计算 方法 .但 对 于 有 Matlab 软件 的 读者 , 直接 就 用 式 (6-88) 计算 也 很 容易 。 

{#1 

为 验证 此 法 的 功效 ， 用 它 对 3 个 不 同 的 分 析 体 系 进行 了 分 析 ， 并 与 经 典 最 小 二 乘 回 归 及 
Kalman 滤波 方法 进行 了 比较 , 发 现 对 于 病态 体系 ， 岭 器 妇 方 法 的 确 优 于 上 述 两 法 ,这 三 个 分 
析 体 系 为 : GO 间 甲 酚 、 对 甲 酚 、 邻 甲 酚 三 元 混合 体系 ; OEM. HE. CEM. LI 
元 混合 体系 ; ORM. MPM. WH. CHM. ЖЫЙ ЛЛ ЖЖ, 它们 的 标准 纯 物 质 
光谱 图 示 于 图 6-11。 从 图 6-11 可 以 看 到 ,它们 的 重合 和 相似 程度 是 严重 的 ,体系 存在 共 线 性 
关系 ,为 病态 分 析 体系 ,用 常规 最 小 二 乘 回 归 和 Kalman 滤波 方法 均 难 取得 准确 估计 结果 。 表 
6-7 列 出 了 岭 回 归 、 常 规 最 小 二 乘 回归 和 Kalman 滤波 方法 的 比较 结果 , 从 此 可 以 看 出 ， 岭 回 
归 的 分 析 结 果 明 显 优 于 最 小 二 乘 回归 和 Kalman 滤波 方法 。 当 体系 的 “病态 ”情况 更 严重 时 
《五 组 分 混合 体系 )， 最 小 二 乘 回归 和 Kalman 滤波 方法 皆 出 现 “ 负 ” 的 估计 浓度 ， 这 说 明 对 于 
严重 病态 体系 ， 上 述 两 种 方法 所 得 结果 的 可 靠 性 很 差 。 


1.0 4 
ШЕ з, 2 
1 
| n A А А А , 
977300 280 260 300 280 260 300 280 260 
波长 /am 波长 /nm 波长 /nm 
(a) 0) ©) 
图 6-11 三 个 标准 体系 的 标准 光谱 图 


(a) 三 元 体系 ! O) 四 元 体系 (0 五 元 体系 
1—4 9E. 2 - HN. SEs CEN 5 В 
从 3 个 混合 体系 中 各 取 一 岭 迹 图 作为 实例 示 于 图 6-12。 从 图 可 以 看 出 ， 当 从 0 开始 变 
大 时 ， 各 个 浓度 估计 值 就 产生 显著 变化 , 这 等 价 于 上 只 需 在 校正 矩阵 的 元 素 上 施加 很 小 的 微 扰 ， 
就 使 最 小 := 乘 估计 值 发 生 显著 变化 (注意 到 当 k=0 时 , PARR КАЛА), ER 
病态 体系 的 最 小 二 乘 估计 很 不 稳定 ; 随 着 值 的 增 大 , 岭 同 归 浓 度 估计 值 很 快 趋 于 平稳 , 这 时 
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ROT 不 同方 法 分 析 结 果 的 比较 


体系 人 浓度 /pg。mi-! | uh Pl | МАРК КЕНЕ MRPE/X | MRPES% 
A00 T nos 13.2 ne 7.25 | xz 
В;10.0 8.08 DES | 
Ci10.0 пі | 10.5 
лао. 0 {10.8 1.32 10.9 TM 712 
了 :5.0 A.R& 4.93 
G80 7.43 73 
A0 Ada 20.3 1.92 18.3 3.67 
b:2.0 1.29 2.18 
Саво 3.68 268 7 А 
Алоо lo | 9.31 10.9 214 5.19 
Fa8.0 8.23 3.53 : 
C.10.0 8.80 | ins, | 
四 元 体系 A100 11.6 32.5 9.69 36.1 2 
B:10.0 тт 4.21 : 
C1100 6.25 1.6 | 
D:10. 0 14.5 14.0 | 
A:10.0 12.7 34.1 34.7 5 683 
Bo. 0 8.42 1.0 
C2100 5.46 9.23 
14.0 10.0 
11.6 19.6 25.4 10.7 6. 88 
4.33 8.25 
7.88 
3.87 ， 
1.4 .B $9.28 | 8.79 
690, 1 
5.59 
| 18.0 
五 元 体系 13.9 74.9 12.0 62.9 | 8.29 
Н:10.0 3.01 3.12 
C:10.0 3.84 166 
242 2.8 
8.58 | | 
5.97 46.2 MEME т?т 
3.24 i 
2.34 ` 
| 89 | 
4.58 4.93 
4.94 49.1 20.7 | 13.1 
456 ! | 
1.30 Pd р 
13.9 9.86 
| 7.28 7.98 
五 元 体系 17.4 56.5 16.5 57.1 14.8 
1.07 : 1.08 2. 86 
| — 6.20 | -4.18 0.08 
18.8 17.2 бозы? 
| 8.11 8. 39 | sa! 


DA XE. BC CIRM, D-H: ЕК, MRPE= QU e)? p dit 100, 
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微 扰 对 解 几乎 不 产生 影响 ， 说 明 擒 回归 的 浓度 估计 是 比较 稳定 的 。 在 此 值得 指出 的 是 ， 有 人 少 
数 情况 岭 迹 赂 并 不 完全 趋 于 平稳 , 此 时 的 上 值 较 难 确定 , 这 说 明 对 此 分 析 病 态 体系 , 岭 回 归 亦 
难 给 出 满意 结果 ， 此 时 ， 对 这 样 的 体系 仍 需 再 用 别 的 有 偏 估计 方法 《如 广义 岭 回 归 、 主 成 分 
回归 、 偏 最 小 二 乘 等 ) 继续 证 实 所 估 浓 度 的 可 靠 程度 。 


1 n 1 
. _ 10 — 
z А то? OR — 
& c 28 
š g 
2 = 
S & Nu 
3 — 
2 6 3 
5 
соб 0.04 0.06 0.08 Ó $829.94 9.06 0.0. 
k Ë 
б) b) 


Стат 


А n | n А 
0.01 0.03 0. 050.07 0.05 о 0.00 ом 066 008 
* H 
(е) (a) 


图 6-12 3 个 多 组 分 体系 的 岭 迹 图 
І 对 申 酚 ，2-- 问 甲 酚 ，3 一 邻 甲 酚 ，4 EM. 5 一 水 杨 酸 
各 组 分 实际 浓度 ，(a) 1- dagt mil; 2—3pg mits 3—2gg > ml; (b) 1—10pg ml '!, 
一 9pg ml“, 3—6gg * mit, 4—7ug* ml 1, (c) BOS oge mb: 04) EON Sp e mi ! 


七 、 多 元 校正 的 分 析 化 学 品质 因数 各 可靠 性 分 析 


分 析 方法 的 品质 因数 ， 如 有 灵敏 度 、 选 择 性 ， 检 测 下 限 等 ， 在 分 析 化 学 中 是 非常 重要 的 概 
念 借 此 可 对 分 析 结果 的 可 靠 性 和 适应 性 给 出 合理 估价 ， 亦 可 作为 选择 方法 和 优化 实验 条 件 
的 目标 函数 。 所 以 ， 将 传统 标量 校正 中 习 用 的 有 关 分 析 方 法 的 品质 因数 拓 广 至 多 元 校正 就 具 
有 十 分 重要 的 意义 了 。 多 元 校正 实质 是 用 矢量 分 析 (EER) 替代 〈 单 变量 ) 分 析 ， 是 传统 
标量 分 析 的 拓 广 。 从 前 几 节 的 讨论 中 可 以 看 出 ,经 此 拓 广 ， 可 获得 很 多 传统 标量 分 析 所 不 能 
得 到 的 重要 信息 。 值 得 提出 的 是 ， 多 元 校正 同样 可 给 出 传统 标量 校正 中 习 用 的 有 关 分 析 方 法 
的 品质 因数 中 ,在 讨论 多 元 校正 的 有 关 分 析 方 法 的 品质 因数 之 前 ,有 必要 先 对 传统 标量 校正 中 
习 用 的 有 关 分 析 方法 的 品质 因数 进行 简单 回顾 。 

传统 标量 校正 的 模型 一 般 可 由 式 (6-90) 给 出 

y=cz+e (6-90) 
Ab, y 为 量 测 值 ;e 为 浓度 ，z 为 仪器 的 灵敏 度 ":1， 或 称 为 响应 系数 ;*e 为 量 测 误 差 ， 一 般 
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БАЕВ ЖШ. AAR IUPAC 建议 , 检测 下 限 由 式 (6-91) ж 
ун 
с=Зо/т 《6-91) 
Җир, о 为 量 测 误差 的 标准 差 ,选择 性 一 般 是 相对 于 共存 干扰 而 言 , 对 一 含有 被 测 物种 
体系 ， 如 某 物种 i 的 灵敏 度 z, 为 较 大 正 数 ， 其余 G1 esis litl sn) 均等 于 
零 或 为 接近 噪声 的 响应 , 则 称 该 分 析 方 法 对 物种 具有 完全 选择 性 ,反之 ,该 法 对 物种 ;的 
选择 性 差 。 
对 于 多 元 以 正 方法 ， 上 述 品质 因数 亦 可 导出 ， 只 是 表示 力 法 由 矢量 取代 了 标量 。 多 元 校 
正 的 矢量 表示 模型 可 由 式 (6-92) 给 出 ， 
6c ex, сохне (6-92) 
Җир, y 为 混合 物 在 m 个 不 同 分 析 道 道 (如 交 谱 则 为 不 同 波长 或 波 数 》 上 所 测 值 组 成 的 矢量 ， 
+ 为 i 物种 在 相应 分 析 通 道 测 得 的 标准 物 量 测 矢 量 ;c, 为 物种 ; 在 混合 物 中 的 浓度 ;e 为 一 等 方 
差 正 态 分 布 的 误差 矢量 。 对 混合 物 光 谱 y， 可 用 构造 正 交 投影 逢 阵 方法 来 进行 解析 ， 先 榨 式 
(6-93》 构 成 正 交 投影 和 矩阵 P;。 
Р, (4, XXH (6-93) 
Җир, Хк Coda xus x0 HERE x WEEER. X 为 其 广义 道 ， 又 称 Moore- 
Penrose 道 , 在 此 XF = (XXX, KI MAY НЕП] ST A). PL 
RSE. RARE. ЛЕВЕ Р, 作用 于 混合 物 量 测 矢量 了 之 上 ， 即 将 其 投影 
至 其 正 交 补 空间 上 ， 则 可 把 XY, G12. eil itl n 的 影响 招 除 ， 即 


y! =Р,у=Р,\сух|-Есх: to Fox Бе) ex te” (6-94) 
这 是 因为 投影 阵 P 具有 一 优良 特性 
Рх, = (1, XX. x = x, — XX; x, 


=x, 0 Gei2ed—ldcklesen (6-95) 
FEM TA RET CE XX? X HX, 的 性 质 。 
为 对 式 (6-95) 求 解 c;, 只 需 对 方程 两 边 左 来 x“, 可 得 
хуг = [lar | * ly | сова) (6-96) 
A уг sex te Py 与 x* 只 相差 一 误差 矢量 , 故 二 者 之 间 的 夹 角 O~0, Bl cos(9)==1, 
于 是 有 


wy S e 1 У с e S a l e a e (6-97) 
对 式 (6-97) 两 边 同 时 除 以 lz" | 得 
Hy? doe xà E met A sc 二 (6-98) 


HA (6-98) 与 式 (6-900 比较 ， 二 者 有 完全 一 致 的 表达 形式 . ER (6-98) 用 矢量 模 替代 了 
式 (6-90) 中 的 单 变 量 信号 。 

1. REE 

AR (6-98) P] у, 1 ае, |x; Í +e BP HL |x; | 与 式 (6-90) 中 工 相对 应 ,因此 1 xz | 
BER ERE HR Rb ; 的 灵敏 着 , 它 表 示 在 单位 浓度 下 多 组 分 共存 体系 中 物种 ; 的 纯 矢 量 
分 析 讯 号 大 小 ， 即 扣除 了 共存 组 分 影响 后 的 物种 i 的 纯 分 析 讯 号 ， 其 卉 纲 与 式 (6-900 完全 
一 样 。 

2， 选 择 性 
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对 于 多 组 分 共存 体系 ， 原 由 式 y 一 cr 十 e ЖШ MPRA iF Re Ey 
у= аду Hert tH од He (6-99) 
ЖЕМ TH ЧИРЕ n OK RE c G=1,2,- n), 除非 和 有 “完全 选择 性 ”无 法 求解 。 
而 由 式 〈6-98) dei BU Ac BE Be IE В LH ae B, 仍 可 得 标量 式 解 , 这 说 明 多 元 校正 模型 可 提高 
分 析 方法 的 选择 性 , 是 其 优 于 传统 标量 校正 模型 的 基本 特征 . 注意 到 在 多 元 校正 的 模型 中 , 可 
供 直 接 和 分 析 用 的 并 非 标 准 量 测 谱 x, 本身, 而 是 经 投影 矩阵 P. 作用 后 ,二 其 余 共存 物 标准 量 测 
谱 的 正 交 部 分 一 - 投影 矢量 хг, 值得 提出 的 是 , 有 时 x, ARB хг. RADARS, ШШ | 
x /xi 有 很 小 。 此 时 用 式 (6-98) 估计 浓度 ， 会 因 e" 的 存在 而 带 来 较 大 误差 。 这 是 由 于 
共存 物种 标准 量 测 谱 之 间 严 重重 登 所 致 ， 通 常 称 为 “病态 ”分 析 体系 ， 如 仍 采用 最 小 二 乘 回 
19, Kalman 滤波 等 一 般 多 元 校正 方法 ,结果 将 很 不 可 靠 …。 因 此， 上 xz [| / | x | 可 视 为 组 分 
z 与 其 他 共存 组 分 的 标准 量 测 谱 之 间 重 登 程 度 的 度量 Lorber ERK HEHA г 的 选择 性 
指标 。 然 而 ， 作 者 认为 该 指标 只 定性 地 反映 了 组 分 量 测 谱 之 重 登 趋势 ， 且 其 可 在 〈0，1) 区 
间 变 动 ， 对 确定 某 组 分 是 否 具有 定量 分 析 所 需 选 择 性 未 给 出 具体 指标 ， 很 难 应 用 于 实际 。 从 
sk (6-98) 可 知 ， 多 元 校正 分 析 的 单 组 分 模型 ， 除 该 被 测 组 分 的 贡献 外 只 与 。'' 有关。 也 就 是 
说 ， 对 于 多 元 校正 模型 ， 其 选择 性 可 参照 单 组 分 模型 的 定 基 测 定 限 来 考虑 ， 只 是 应 注意 到 必 
须 用 投影 矢量 x 的 模 , 即 所 谓 标 准 谱 的 纯 分 析 信 和 号 | x: | 来 考虑 , 实 因 标 准 谱 的 纯 分 析 信 和 号 
| x | 已 经 扣除 了 共存 诸 组 分 的 共存 影响 。 根 据 Currie ”提出 的 “定量 测定 限 ”之 定义 ， 当 
АЖЕ ХЕ 10 时 , 则 该 组 分 的 分 析 信 号 能 用 于 可 舍 定 景 测定 , 综 上 述 讨 论 , 建议 将 多 元 校正 
的 组 分 选择 性 定义 如 下 : 
SELS I| xf l/e * = Wat | 7G x Dm [рх ПАА 14 (6-100) 
由 式 (6-100) 定义 的 多 元 校正 模型 的 选择 性 指标 表面 是 -个 标准 谱 的 信 品 比 。 但是, Ж 
际 上 它 与 一 般 信 唤 比 不 同 。 不 岗 之 点 在 于 它 是 建立 在 由 式 〈6-98》 定义 的 单 组 分 模型 之 上 的 。 
这 是 一 个 经 数学 变换 扣除 了 共存 诺 组 分 的 影响 后 的 单 组 分 模型 ， 所 以 实际 上 反映 了 共存 诸 组 
分 对 组 分 i 的 定量 测定 的 影响 。 另 外 , SELS. |x: | / lx, Ar 的 > 为 仪器 量 测 的 相对 误 
善 ,这 是 考虑 到 分 析 工作 者 一 般 都 知道 一 些 仪 器 的 量 测 相对 误差 ,将 其 引信 可 方便 选择 性 指标 
的 运算 。 对 于 紫外 可 见 光 谱 , 仪 器 的 标准 谱 的 量 测 相对 误差 一 般 可 设 为 2⁄9, 
根据 Currie 标准 ， 当 SEL, 关 10 f, 则 该 物种 能 由 一 般 多 元 校正 方 添 可 靠 定量 测定 , AA 
同时 测定 所 需 的 选择 性 ， 当 3<CSEL,<10 时 ， 因 此 为 定性 纯度 保证 范围 ， 其 选择 性 只 满足 半 
定量 测定 要 求 ; 当 SELLI 时 ， 则 说 明 该 物种 经 扣除 共存 组 分 影响 后 的 纯 分 析 信 号 如 果 小 于 
误差 相差 的 3 倍 ， 有 被 误差 济 没 的 可 能 ， 此 时 该 组 分 的 选择 性 不 能 满足 定量 分 析 要 求 。 由 式 
(6-100) 定义 的 组 分 选择 性 可 方便 地 对 待 分 析 混 合 试 样 在 解析 前 就 进行 选择 性 估价 ,只 需 用 投 
ЖР, 对 x 进行 投影 运算 而 得 到 cn. 电 此 可 计算 出 | zx 上/ Ls E. 继 与 仪器 的 量 测 相对 误 
差 一 比较 ， 即 可 知 该 体系 能 否 准 确定 量 了 。 
3. 检测 下 限 
对 应 式 > 一 cz 十 *， 可 定义 多 元 校正 的 组 分 检测 下 限 ， 
LOD,=3a/SEN;,=3o/ || x? | (6-101) 
式 中 ,o 为 量 测 误差 标准 差 , 建议 使 用 多 个 在 相同 条 件 所 得 估计 值 的 均值 较为 可 靠 。 如 o 已 知 ， 
则 用 实际 经 验 估计 的 更 为 合适 。 
EID 
根据 误差 传递 理论 ， 结果 的 相对 误差 ，Acwww/c.， 来 自 两 个 方 而 ， 即 混合 物 基 测 相对 误差 
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Ac. c, 和 标准 物 量 测 误差 Ае,,/с,, Ast (6-102) RH: 
Be rota Дс HAC ie 
SUP. c 组 分 i 标准 量 测 谱 所 含 浓度 . 在 多 组 分 共存 时 ， ES ESSE T2 


应 为 混合 量 测 谱 中 的 该 组 分 的 纯 分 析 信号 || ye 


RA (6-98) 可 得 


cx yd Cx ly 


lx? d mE Ax yl x | cen 


sexs ty" || x; 


即 
| 


y Поу /C |x; |10) 


因 Ас, s/c, 与 在 混合 物 量 测 中 对 于 组 分 ; 的 信 噪 比 呈 倒数 关系 ， 则 有 


Асо =o || x" 
=[ lx? 


式 中 , <, 称 为 混合 物 量 测 谱 中 物种 ; REE BML, x 


完全 仿 此 进行 ， 只 需 将 у Hom x, 
Ac... cz, =a | 


=[| 
于 是 式 (6-102) 可 写成 


[Gry soles Voy UC y Gy] 
I фу (ey САРАЕВО: 


即 可 


x db VE у Gor] 
x | y/o JG! | yl] =<. yl 


Асла, = Ае, е, Ас, de =k or | y lH os cof lly D 


= 41 


在 此 只 假设 了 标准 量 测 谱 与 混合 物 量 测 


FG l| y = Hanae! | y D 


误差 传递 数 ， 其 大 小 将 说 明 分 析 结果 的 误差 大 小 。 


第 三 节 灰色 分 析 体 系 的 多 元 校正 方法 


已 知 待 测 物 存在 于 待 分 析 的 样本 中 ， 但 是 否 存 在 别 的 未 知 
干扰 却 不 清楚 ， 分 析 目 的 是 在 未 知 干扰 的 存在 下 ， 直 接 对 感 兴趣 的 待 测 物 进行 定量 分 析 。 此 
类 分 析 体系 可 以 说 是 分 析 化 学 家 碰 得 最 多 的 一 类 体系 ， 因 其 定性 组 成 只 部 分 已 知 ， 介 于 白色 


灰色 分 析 体 系 的 基本 特征 为 : 


与 黑色 分 析 体 系 之 间 ， 故 将 其 称 为 灰色 分 析 体 系 。 
灰色 分 析 体 系 的 校正 算法 将 以 矢量 校正 方法 和 甜 阵 校正 方法 为 


(6-102) 


| 与 噪声 标准 差 c 的 比值 。 从 式 (6-97) TM. 


《6-103) 


(6-104) 


(6-105) 


(6-106) 


于 标准 物 量 测 湛 物 种 的 误差 传递 数 可 


(8-107) 


(6-108) 


ЖЕШ UR ERE o 相等 。w.eu 称 为 组 分 ; 的 


RR, LRH. АЖ 


论 上 说 ， 如 没有 特殊 条 件 ， 基 于 矢量 校正 的 方法 ， 如 本 书 将 要 介绍 的 选 代目 标 转换 因子 分 析 
法 (ITTFA)， 自 适应 Kalman Ё (AKF), 局 部 曲线 拟 合 法 LCF) 等 , 一般 只 能 给 出 可 


能 解 ， 虽 其 实用 性 受到 一 定 限制 ， 


但 对 一 些 情况 仍 有 一 定 参 考 价值 ， 而 且 ， 因 


对 以 后 的 进 


一 步 研究 具有 启发 作用 ， 故 本 书 仍 给 出 了 详细 的 介绍 。 撼 降 校正 方法 是 分 析 化 学 计量 学 研究 
的 难点 和 热点 ， 并 在 近年 来 取得 了 较 大 成 果 。 其 中 著名 的 有 广义 秩 清 失 因子 分 析 法 


(GRAFA), 残 差 双 线性 分 解法 (RBL) 和 约束 背景 双 线性 分 解法 (CBBL), Mal 


数学 的 角度 


看 ,这 些 方法 一 般 丝 可 给 出 有 物理 意义 的 唯一 解 ， 可 在 实际 分 析 化 学 的 应 用 中 ， 还 存在 着 一 


些 具体 困难 值得 进一步 研究 。 
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—, 矢量 校正 方法 


矢量 校正 方法 是 用 于 矢量 类 型 数据 模型 的 - .类 算法。 它们 只 适应 可 产生 矢量 数据 的 一 类 
仪器 ， 常 见 的 有 紫外 可 见 光谱 ， 红 外 光谱 ， 拉 受 光谱 ， 质 谱 及 某 些 电化 学 谱 ， 其 基本 数学 模 
型 可 由 下 式 给 出 


y=Xex.++r+e=Xce4 r—e (6-109) 
UB. 是 混合 物 的 量 测 矢量 , 一 般 假设 在 大 个 分 析 通道 (可 以 是 波长 , 波 数 等 ) 上 量 测 所 得 ; 
xl, n) 是 待 测 物 的 纯 谱 矢量 ; Gm 1.2, on 为 待 测 物 的 浓度 ; r 为 干扰 矢量 ;e 是 
量 测 误 差 ， 仍 假设 为 服从 正 态 分 布 的 零 均 等 方差 且 不 相关 的 白 噪声 误差 。 一 般 说 来 ， 有 >" 
的 要 求 ， 否 则 无 法 求解 。 另 外 ， 值 得 提出 的 是 ， 式 (6-109) 的 r 可 以 是 儿 个 干扰 物 的 线性 组 
$. 即 
r= rr, (6-110) 
Җир, x/(j 二 1,2,… sm) 为 干扰 物 的 纯 物种 标准 谱 , ct 一 1 Zenon 为 其 相应 的 干扰 物 的 浓 
度 。 值 得 注意 的 是 , 从 由 式 (6-109) 给 出 的 模型 可 以 看 出 ， 不 管 干 扰 物 是 由 多 少 物种 构成 的 。 
它 总 被 看 成 为 一 个 背景 矢量 ， 这样， 可 简化 我 们 的 模型 ,但 是 ， 这 也 给 求 有 物理 意义 的 唯一 
解 带 来 了 困难 。 这 在 以 后 的 讨论 中 将 逐步 展开 。 
(一 ) 投影 算法 和 多 元 校正 模型 的 检验 
【基本 思路 】 
因 灰 色 分 析 体 系 的 基本 特征 是 已 知 待 测 物 存在 于 待 分 析 的 样本 ， 但 是 否 存在 别 的 未 知 干 
扰 不 清楚 ， 故 首先 确定 该 分 析 体系 是 否 确实 存在 赤 知 干扰 就 二 分 重要 了 。 可 以 说 , 这 是 解析 
项 色 分 析 体系 的 第 一 步 。 如 果 该 体系 经 检验 确实 存在 干扰 物 ， 此 时 ， 如 用 第 三 章 中 讨论 过 的 
和 白色 分 析 体 系 的 解析 方法 ， 如 多 元 线性 回归 ,Kalman 滤波 ， 偏 最 小 二 乘 等 ， 将 不 能 获得 准确 
解 ， 必 须 采 用 可 排除 干扰 的 新 算法 。 投影 算法 就 是 一 种 这 样 的 多 元 校正 模型 的 检验 方法 ， 其 
基本 思路 是 : 如 混合 样品 中 确实 只 含有 待 测 的 几 种 物种 ， 则 混合 物 光 谱 矢 量 必 可 由 这 几 种 已 
пвие хаана, дл, ТОКЕН ЛОН DI PETS 
构成 的 线性 空间 之 中 , 只 需 用 这 几 个 纯 物种 光谱 组 成 一 正 交 投影 矩阵 ， 对 其 进行 投影 运算 , M 
可 得 一 零 矢量 ,也 就 是 说 ， 其 正 交 补 空间 为 一 零 矢 量 空间 。 反 之 ， MRAP SRR 
扰 物 ， 则 其 正 交 补 空间 不 为 零 ， 这 就 构成 了 该 法 的 数学 基础 。 
【 正 交 投 影 乍 阵 的 构造 及 其 性 质 了 
要 对 由 (6-109) 式 表示 的 灰色 体系 数学 模型 进行 检验 ， 关键 是 要 找到 一 个 正 交 投 影 矩阵 
来 对 混合 物 量 测 矢量 进行 投影 运算 。 在 构造 正 交 投 影 矩阵 之 前 ， 有 必要 对 投影 矩阵 给 出 必要 
的 介绍 。 AREER, 是 一 类 对 称 堵 等 阵 (参见 第 十 一 章 )。 对 于 由 《6-109) 式 表 出 的 校正 
模型 ， 作 为 检验 用 的 止 交 投影 校正 可 由 式 〈6-111) 给 出 。 

Р=(1—ХХ”) ‹6-111) 
хф, АВТАВ, х= (хх эх, Bl СР ИАЕА ER 
PE TI X^ RS HU O3 AREK Moore-Penrose 35 ,— LBL Kuh — 338 BY 

х= (ХХ) ^X (6-112) 
RE ME (SRB 3), RA PHT — ХЕ, 

P—-XX^Y-F—(XX"Y-I—XX =P (对 称 ) (6-113a) 
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PP—-U-XX )4—XX')-1-2XX —XX XX =1--ХХ =P OD 
(6-113b) 
如 果 将 由 式 (6-113) 定 义 的 正 交 投 影 阵 作用 在 由 式 (6-109) 给 出 的 混合 物 重 测 矢量 上 , 则 有 有 
у= Ру= ОХХ?) (Хсфг+е) = Хе ХХ Xe+ Q—XX r (I—XX*t)e 
—XX'*)r- G-XX )е= ғ" +e" (6-114) 
Mak C-11 0 SE ph g rh u] DUE HL LR GR C6-114) A AEAEE FRAR E 
矢量 那 一 项 ,可 知 经 这 样 的 投影 运算 后 .就 只 剩 下 误差 项 ,在 此 e" MA RASH SHEN 
随机 矢量 ,反之 , 若 体系 中 含有 未 知 干扰 , 则 除 此 误差 项 外 .还 有 一 项 六 ,除非 "可 由 与 一 Co， 
zt 线性 表 出 。 因 有 普 的 存在 ,就 不 是 一 零 均 等 方差 的 误差 矢量 了 。 
【统计 检验 】 
根据 以 上 分 析 , 可 建立 如 下 的 模型 检验 方法 ,首先 ,用 + 分布 检验 y 是 否 为 -- 零 均 的 随机 
矢量 , 即 原 假设 瑟 ,:E(y.) 二 0, 令 统计 量 了 为 
T=(E(y)—0) x /k—1/S, 


TEX .5,= V XD EOF ЕСО) = Уу. 如 IT s MEE BUR, H. to 可 由 :分布 
表 查 得 。 

BOR y! = Gu oyd 进行 均值 检验 尚 不 充分 ,还 需 检 验 y" М, ИТІН 
Ny? 上 ,是否 显著 大 于 量 测 误 差 ,光度 分 析 的 量 测 误差 一 般 在 1%~2% 之 间 , 故 可 假设 其 方差 
В FRIE: 


o'=0.01X || y || ° (6-115) 
dy 12/0 |у" 12/0. ох | у >3, 
即 此 时 的 信 品 比 大 于 З, ARABS br ke rh ИЕ Т oo LU kal. АГА OR F fr k T 
扰 物 ,不 能 认为 y "是 一 随机 误差 矢量 。 
综 上 所 述 , 如 果 

>22 H — dy die3. 
则 可 认为 校正 模型 不 正确 ,体系 确实 存在 有 未 知 干扰 物 , 此 时 不 能 直接 使 用 白色 分 析 体 系 的 校 
正方 法 来 进行 校正 ,必须 先 排除 背景 干扰 。 表 6-8 与 表 6 9 给 出 了 一 些 具 体 实例 *。 


ROS 校正 模型 的 检验 结果 


m 体系 实际 存在 的 物种 ттт 
1 [| GODXNICO Св) | 1.991 28.6 | FETH 
2 CrCEXNiCI) —0, 0168 0. 38 模型 正确 
3 Стеж), NICE ) Coll) CrCIED,NiC12 1.883 15.4 FETH 
4 CrC E), NICE), Col 1) Соби, міСа ә Соба? 0. 347 0, 754 REER 
5 |a з | 59.4 | PEFR 
6 m Ж 0. 964 I 3.12 模型 正确 
7 | thu ed SHE 1 10.48 — | 51.18 | EER 
8 EHE K RHE RE 0.765 ! 0. 968 模型 正确 
9 | анж. SHEILA IUE | MEEA REE 0.436 47 | FETE 
10 изиж. LBL OR МЕНИ, ERMA 1 0.029 1 0.462 模型 正确 
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#60 计算 结果 比较 


@ s X mox Ж 未 经 模型 检验 的 分 析 结 果 模型 校正 后 的 分 析 结 果 

1 Cr CL 9,3. 20mg/ml CrC B), 7. Aómg ml CeT ,3.30mgm 
Nu 1,2. 20mg/ml | Í NiCID.2.21mg/ml 

3 Ci OE» ,6. A0mg/ml 1 CrCHD,10. 3mg ml Crt X). 6. 40mg/ml 
NICI 2,2. 20mg/ml NiC I 2.1. 70mg ml Nit 82,2. Z1 mg/ml 
CoC 1 ).1. 76mg/ml CoC t ),1. 77mg/ml 

7 RHEO 7mg + L7! GERE 0 675mg + L 
KO. 10mg+ L7! 3*0. 567mg<L #@.0.107mg+ L7? 

9 氨基 上 比 林 ,10. omg Lo? 氨基 比 林 ,16. dmg’ L7? 氢 基 比 林 ,10. mg ，L-! 
PIL ,1.80mg * L! Bk3.l.almg st | 巴 比 要 ,1 79mg « 1.-1 


R Ak Omg e L7- 
TERNA Б Ж 6-8, 


Mk 6-8 与 表 6-9 的 结果 可 以 看 出 , 如 不 经 校正 模型 检验 , 对 于 校正 模型 不 确定 的 分 析 体 
系 ， 直 接 使 用 常规 的 白色 分 析 体系 的 解析 方法 ， 如 最 小 二 乘 回归 ， 进 行 多 组 分 问 时 测定 ， 所 
得 结果 是 不 可 靠 的 值得 特别 指出 的 是 ， 对 于 校正 模型 的 检验 ,只 用 + 检验 是 不 够 的 ， 这 从 表 
6-8 中 的 第 9 号 样本 所 得 结果 就 可 以 看 出 。 

关于 排除 于 扰 可 分 为 两 种 傅 况 ， 一 种 是 已 知 可 能 存在 干扰 物种 的 大 致 范围 ， 此 时 可 分 别 
记录 各 可 能 干扰 物种 的 标准 量 测 谱 ， 并 癌 时 对 其 进行 投影 运算 ， 继 用 检索 方式 以 确定 于 扰 物 
HHR, 然后 只 需 将 其 代 人 式 (6-109)， 继 用 白色 分 析 体 系 的 解析 方法 ,立即 可 求 出 待 测 物 的 
浓度 来 , 有 关 例 子 可 参见 文献 [100]; 另 一 种 情况 是 有 关 未 知 于 扰 物 的 信息 一 无 所 知 ， 这 种 情 
况 的 处 理 比较 复杂 ， 下 面 即将 对 这 种 情况 进行 详细 讨论 ， 

(=) 标准 加 入 和 迭代 目标 转换 因子 分 析 法 

目标 转换 困 于 分 析 法 曾 用 于 含 已 知 于 扰 组 分 的 混合 物 同时 测定 ""' ,但 此 法 很 礁 用 于 含 未 
知 干扰 物 的 多 组 分 分 析 体 系 。 实 因 目 标 转换 需 设 定 实验 光谱 矢量 。 在 组 分 干扰 未 知 的 情况 下 ， 
实验 矢量 无 从 选择 ; 另 一 方面 ,因子 分 析 法 要 求 /个 各 组 分 浓度 不 同 的 混合 试 样 以 构成 数据 答 
阵 。 且 / 应 大 于 待 测 组 分 数目 >， 而 分 析 工作 中 常 只 有 一 份 含 未 知 干扰 的 多 组 分 混合 试 样 ， 除 
非 借助 另外 的 分 离 手段 。 

【基本 思路 】 

在 这 里 将 要 介绍 的 标准 加 入 选 代 目标 转换 因子 分 析 法 "1, 其 主要 思路 是 将 标准 加 人 , E 
阵 投影 运算 及 迭代 目标 转换 等 技术 结合 起 来 , 构成 一 个 新 算法 , 先 完成 未 知 干扰 背景 的 检 出 ， 
从 而 使 其 转化 成 为 简单 的 白色 分 析 体系 ， 继 用 第 三 章 的 直接 校正 方法 即 可 进行 单个 或 多 个 待 
油 组 分 的 定量 分 析 测定 。 

对 于 由 式 〈6-109》 表 出 的 灰色 分 析 体系 的 校正 模型 ， 借 前 一 节 已 讨论 过 的 广义 标准 加 入 
法 , 分 别 对 混合 试 样 加 入 标准 待 测 组 分 , 从 面 得 到 一 组 标准 加 入 系列 洲 液 的 量 测 矢 量 了 (一 1， 
2,1—1), ARAME: Y Гу, yU s 727, 注意 ,在 这 里 要 求 >n, ЩН, Уй 
是 由 式 (6-100) 表 出 的 原始 量 测 矢量 。 继 对 矩阵 了 进行 主 成 分 分 解 〈 奇 异 值 分 解 ) 可 得 

Y—USV —UT 《6-116) 

Җир. 开 和 了 分别 为 两 个 正 交 标 准 化 矩阵 ，$ 为 UXD BE 

显然 ,如 果 体系 中 存在 未 知 干扰 背景 ， 则 了 矩阵 的 秩 为 (ax 二 1)， 否 则 ， 其 秩 为 =。 因 本 
节 只 讨论 体系 存在 未 知 干扰 背景 的 情况 , 故 需 取 (> 十 1) 个 对 应 于 较 大 特征 伪 (BBS 矩阵 中 的 
对 角 元 素 之 值 ) 的 特征 矢量 来 构成 主因 子 阵 问 ， 因 此 
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了 一 XC 一 DRR T (6-117) 
OR (6-117) 中 ， 于 二 [ee 中， 即 由 已 知 待 测 物 标 准 光 谱 为 列 矢量 加 上 林 知 背景 十 
扰 光 谱 矢 量 所 构成 的 矩阵 ， 另 外 ， 有 


C'=C,+ AC 
其 中 

e а 
a G 

Ce : (6-118) 
C Ca 
1 1 

[0 Ac Aca 

Bey Асы E 

ac=}i i — d E (6-119) 
O A Ae, rH Mis 


0 0 о о 0 

在 此 Ac RR i 次 对 第 ;个 待 测 组 分 加 入 的 浓度 , 而 旦 在 加 入 时 使 背景 干扰 的 浓度 实际 保 
持 不 变 ， 在 实际 标准 加 和 时， 为 保持 这 一 条 性， 可 采用 加 入 小 体积 的 较 流 标准 溶液 或 采用 稀 
释 至 相同 体积 的 方法 。 在 式 《6-117) P. 短 阵 情 称 为 转换 矩阵 ， 它 将 抽象 波谱 因子 矩阵 如 
CRORE) 和 抽象 浓度 六 子 矩 阵 T 转换 成 为 有 物理 意义 的 真实 标准 量 测 谱 年 阵 Y 和 真 
Sci HERB IE C, 

EE THER BRR RABE ЯП » PR ERWA А. BOR К ERER а 
rG—1,2, 1) 来 ， 这 是 因为 XC' 一 0 一 CRR 'T', TA 


X=UR (6-120) 
实际 上 ， 如 果 将 式 6120 SRARA, WA 
x=Ur GL enn) (6-121) 
HAR 06-120) P, 五 为 已 知 矢量 ， 用 最 小 二 乘法 解 此 方程 ， 立 即 可 得 
r= (UU) 1 (6-122) 


Ad, UAE, ИТД CU :的 求 递 很 容易 ， 实 际 上 就 是 对 角 特 征 值 矩 阵 的 倒数 阵 。 
利用 式 (6-122) 可 以 求 得 忍 矩阵 的 ” 列 。 但是, 因 对 背景 干扰 量 测 矢 基 事 先 无 任何 已 知 依 息 ， 
只 可 采用 选 代 法 来 求解 。 
【基本 算法 】 
CO 迭代 初始 矢量 的 选择 ”迭代 初始 矢量 的 选择 将 决定 选 代 能 香 收 伍 至 正确 值 ， 这 就 要 
求 达 代 初始 矢量 合 有 背景 干扰 矢量 的 基本 信息 ， 而 其 他 待 测 组 分 量 测 矢量 的 影响 则 应 尽量 扣 
除 ， 选 代 结 果 方 可 朝 背 景 量 测 矢 量 收 敛 ， 这 是 解决 问题 的 关键 所 在 。 在 这 里 我 们 采用 待 测 组 
分 的 标准 量 测 矢量 构成 投影 矩阵 
Р=(1—ХХ*) (6-123) 
式 中 ,了 为 (EX&) ЖШ. X= Gn vate yore ЭИ ЩН E ЖЖ ИЕ ЕТА PLACER ER, BG 
阵 ;X+ 则 为 其 广义 道 , 亦 称 Moore-Penrose 31, — WERE Е АЕ Е, Вр 
Xt = (XX X (6-124) 
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用 此 矩阵 PMA ИШ у 进行 投影 运算 ， 所 得 的 投影 矢量 y RRA EREHE 

Ж. WA, 投影 矢量 y" 与 所 有 待 测量 测 和 撩 量 都 正 交 ， 即 
yUx-0 (i=1,2. 0) (6-125) 
这 是 因为 
yx Sy my" PPr =y" P-XX x, 
Ly'PG-XXx)-y'PQ)—0 б=1,2 э) 

在 上 述 推 导 中 , ЖШТ BU EE ЗТ EO XX" X-X, ЖК ХХ 
的 性 质 。 正 是 由 于 投影 矢量 yn SAM ВЕ ЕТЕ Ж. 所 以 ， 可 以 说 , 这 样 选 出 来 的 
初始 选 代 矢量 咏 "已 将 各 已 知 待 测 组 分 对 混合 物 量 测 矢量 的 贡献 全 部 扣除 。 

(2) 只 代 过 程 ” 用 上 述 方法 得 到 初始 选 代 矢 量 "后 ,将 其 作为 背景 干扰 矢量 的 初始 估 
计 闫 ， 并 用 其 取代 式 吕 一 gr 中 的 二， 由 式 (6-122) RH rE, ER Ur RAP 
HARS DETE WUE, ИЖ. MISS | PRR ЖЕНЕ, Ж 
止 选 代 ， 此 时 所 得 的 最 终 矢 量 则 为 可 能 的 背景 干扰 矢量 。 此 法 求 出 的 背景 干扰 只 是 一 种 可 能 
解 ， 当 青 景 干扰 详 与 待 济 物 种 的 量 测 矢 量 的 重 全 度 不 大 时 ， 用 此 法 求 得 的 背景 干扰 矢量 十 分 
排 近 真实 的 背景 干扰 ， 但 是 当 背 景 干扰 席 与 待 测 物种 的 量 测 矢 量 的 重 营 度 很 大 时 ， 一 般 很 难 
得 到 真实 解 。 

(=) Ві Kalman BRK 

在 第 三 章 中 对 Kalman QE HE FELT i @ ЭТИ Ж B) BT Ë T TE AULAE A 
Kaman ОИ BERI RT AP КЕЕ (E Te. VR ERA RE. БЕ 
应 Kalman 3E ВЧТ ЕТ Я I n 

常规 Kalman 滤波 算法 方程 可 总 结 列 于 表 6 10. 


#610 常规 Kalman 滤波 算法 方程 


状态 估计 模型 ADR) (6-126 
ELIO уб) = хб Hk) (6 127) 
Kalman 增益 RCA) = PC) xB) [e kV PO 0007 1 (8-128) 
误差 协 方 阵 估计 PUO = П ООР ge DxGO' а Dr ge D* (6-129) 
状态 估计 递 扒 eO m eG DERD Ly) — x hee] (6-130) 


ER 6-10 фс RED EE: ETT ORM ER 
点 上 的 系数 矢量 , 即 通常 所 说 的 敏感 系数 , 可 以 是 摩尔 吸光 系数 等 ; y(&) 为 在 第 个 量 测 点 上 
混合 物 的 量 测 值 ;r(&) 为 在 第 上 个 量 测 点 上 的 量 测 误差 ;大 (如 则 称 为 第 “个 量 测 点 上 的 Kahman 
增益 矢量 ; P(A) 为 在 第 上 个 量 测 点 上 的 量 测 协 方差 阵 的 估计 。 新 息 序列 的 定义 是 : v= 
ye) — xy CCR) ,实际 上 就 是 第 上 个 量 测 点 上 的 估计 残 差 ,这 个 信息 对 阅 节 递归 的 动态 模型 很 
ЖШ, Hoe Kalma 算法 中 占有 十 分 重要 的 地 位 。 自 适应 Kalman 洪波 就 是 建立 在 这 一 概念 
之 上 。 

首先 ， 当 校正 模型 不 正确 时 ， 亦 即 当 混合 物 测 矢量 中 含有 来 知 干扰 时 ， 如 果 校 正 模型 正 
确 ， 新 息 序列 应 该 为 一 具有 零 均 不 相关 的 白 噪声 系列 ， 实 因 "( 如 就 是 第 个 量 测 点 上 的 估计 
残 差 。 估 计 残 差 是 一 个 很 有 用 的 指标 ， 如 果 估计 残 差 比 较 大 且 具 有 一 定 的 相关 性 ， 就 说 明 用 
于 校正 的 模型 存在 问题 ， 被 估计 的 参数 当然 也 不 正确 .因此 ， 正 如 第 二 节 所 讨论 的 那样 ， 新 
息 序列 是 -- 个 检验 校正 模型 的 很 好 指标 。 在 此 ,以 个 例 于 来 说 明 。 图 6-13 (а) 示 出 了 一 个 
由 3 个 Guas 峰 模 三 个 组 分 (а, b, c) 构成 的 混合 物 光谱 ， 如 果 只 用 两 个 组 分 (ay b) 来 构 


240 


成 校正 模型 , 所 得 新 息 序列 如 图 6 13 (b) 所 东 。 在 第 二 个 组 分 (c) 还 没有 出 现 之 前 ,Kalman 
滤波 的 新 息 序 列 明 显 是 具有 白 噪声 性 质 的 ,这 说 明 校 下 模型 在 已 被 滤波 的 这 一 段 是 正确 的 , 然 
而 ， 一 且 第 三 组 分 开始 有 吸收 时 ， 新 息 序列 开始 变 大 且 具 相关 性 质 ， 这 说 明 校 正 模 型 已 不 正 
确 了 ,在 这 样 错误 校正 模型 下 估计 的 浓度 亦 将 不 准确 了 .从 上 述 结果 可 以 看 出 ,因为 Kalman gë 
波 是 递归 进行 的 , 当 校 正 模 型 正确 时 ,新 息 序 列 给 出 模型 正确 的 信息 ， 如 果 模 型 发 生 错误 , 新 
息 序列 马上 发 生变 化 ， 给 出 模型 链 误 的 信息 。 这 就 提示 我 们 ， 只 要 能 利用 新 息 序 列 所 提供 的 
这 些 信息 , 就 有 可 能 将 Kalman 滤波 技术 用 于 床 色 分 析 体 系 的 解析 , 这 就 是 将 要 讨论 的 自 适应 
Kalman 5, 


A 
新 息 系列 


©. 


波长 /nm 波长 /nm 
(a) 7] 
图 6-13” 自 适应 Kalman 滤波 解析 灰色 体系 原理 示意 图 
TE: GO .= 组 分 体系 的 光谱 图 ，1、2、3 ЖЕНЯ АЛШ. Moh 3 CS ЖДО ЙН; Lg e Ө ЖН. 
(b) REIR 1、2 两 组 分 校正 模型 的 Kalman 滤波 的 新 息 序 列 


【基本 思路 了 

为 了 防止 模型 错误 而 导致 的 Kalman 滤波 算法 估计 失败 的 情况 ,人们 可 采用 筷 送 应 技术 。 
一 般 的 Kalman 滤波 都 是 用 不 变 的 r(&) 来 进行 计算 ,而 自 适应 Kalman 滤波 方法 就 是 通过 在 滤 
波 过 程 中 调节 ch) 来 抵制 模型 错误 ， 它 的 佑 计 可 以 由 下 式 给 出 "*， 

rh) = U/ml Dek Dv&— D ]—xG) POOxGO 

RP, m 是 新 息 序列 求 和 的 窗口 大 小 .上 式 通过 前 m 次 所 效 得 的 新 息 序列 来 估计 +(&) 的 大 小 。 
而 r() 的 大 小 对 滤波 算法 的 影响 可 由 表 6-10 列 出 的 Kalman 增益 估计 式 看 出 ， 当 校正 模型 正 
确 时 ,zr(&) 就 很 小 ， 这 时 表 6-10 列 出 的 状态 估计 式 对 新 的 量 浏 信息 很 敏感 ， 新 息 序 询 的 变化 
也 相应 很 小 。 当 模型 出 现 错误 时 ,r( 名 将 很 快 变 大 ,从 而 使 Kalman 增益 变 小 ,使 得 由 表 6-10 Я] 
出 的 状态 估计 式 对 新 的 量 测 信息 不 敏感 。 这 样 通过 估计 r(&) 如 此 进行 的 自 适应 调整 ， 使 得 
Kalman 滤波 算法 甚至 在 模型 错误 的 条 件 下 , 亦 即 在 有 木 知 干扰 的 灰色 分 析 体 系 的 情况 下 , 也 
可 较 正确 地 估计 体系 待 测 物种 的 浓度 。 

自 适应 Kalman 滤波 算法 除 能 得 到 准确 的 浓度 估计 以 外 , 通过 自 适 应 调整 ， 它 还 可 能 在 量 
测 过 程 中 得 到 正确 的 校正 模型 。 国 为 r( 有 实际 上 是 一 计算 的 方差 ,而 这 方差 正好 代表 了 在 第 
上 量 测 点 上 的 模型 误差 . 这 样 ,一 个 新 的 校正 矢量 x(8) 可 以 通过 r(&) 计 算出 来 ,对 于 本 节 讨论 
的 含 未 知 干扰 的 校正 模型 ,无 非 是 要 找到 背景 干扰 的 量 测 系 数 , 即 在 原 模 型 的 校正 矢量 x) 
中 增加 一 个 新 分 量 


х\ a mb [Lr (Rm/2) 1 如 果 BCR) >0 (6-]3ta) 
xA) =O В 506) <0 (6-131b) 
式 中 心 为 愿 校正 模型 的 组 分 数 ,所 以 x OO REPRE ROR ЖЖ. RPH r Atm 
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2) ba Eak SE DES ЗЕ m 个 新 息 序 列 数据 来 进行 调节 , 另外 ， 式 中 的 РОО 
XWF: 
[ESI dn Melk jm) m> (6-1322) 
bU) --1 WRP jtmi2)/m<0 (6-132b) 
X (6-128) 两 式 的 目的 是 为 了 决定 校正 模型 偏差 的 符号 , Wik ЕД BL ii m TB 5 p| AY 8k 
据 的 平均 值 来 决定 的 。 式 (6-127) 的 采用 是 因为 一 般 的 多 组 分 校正 模型 量 测 系数 都 是 正 值 , 即 
组 分 浓度 的 响应 一 般 都 是 与 浓度 成 正比 的 。 
【基本 算法 】 
从 以 上 对 自 适应 Kalman 滤波 的 介绍 可 以 看 出 ， 误 莽 协 方差 阵 PC) 的 初始 值 的 选择 与 党 
规 Kalman 滤波 算法 是 相同 的 。 只 要 给 出 cC8) 和 P(8) 的 初始 值 , 即 e(40) 和 和 POO, WARR 
(6-128) 计算 其 增益 矢量 , 然后 按 式 《6-130》 和 和 式 (6-129) 计算 下 -个 cl 和 和 了 PC), 当 到 一 
EER GBR RED KF m 时 ,用 式 (6-131a} 或 式 (6-131b) 来 计算 背景 干扰 x(&),, 1。 所 以 ， 
自 适 应 Kalman 溃 波 具体 算法 可 由 下 列 步 又 组 成 : 
D HEMÉ 00) =0,Р(0) —Y' TUR Kk OPETE RRMA OR RD ,这 里 
了 为 单位 矩阵 7° 为 初始 估计 的 量 测 方 差 .此 值 按 式 (6-133) 经 验 式 估 出 
=air(DD /Lx Lx): (6 133) 
式 中 , a 为 一 与 计算 机 精度 相关 的 内 子 , 一 般 可 取 10—100, 值得 提出 的 是 , P (0) 取 值 太 小 . 
可 导致 有 偏 估计 , 如 取 值 太 大 , 则 尽管 参量 的 估计 值 是 无 偏 的 , 而 由 于 量 测 点 数 不 足 够 大 叶 ， 
P (0) 的 最 终 估计 值 仍 会 偏 大 。 
(2) WARE m, WEE 10—20 之 间 均 可 。 
(3) 启动 计算 


gh) = PG-- 1) x(k) [x QD PG — DxG0 trey (6-134a) 
cQ) —eG — D tg) [x0 — хб &'е(#—1)] (6-134b) 
P= [Ig ADAY JPR DLE g(&— Dx GO ]--g&— Dr (100 (6-135) 
дир, ИН” HHT ,可 根据 实际 量 测 噪 声 方 差 具 体 确 定 。 重 复 此 步 计算 直至 弟 
归 次 数 大 于 m. 
《4 利用 下 述 计算 式 浓度 估计 未 知 干扰 谱 


xG), = BOR) E+ m/2) ]? ШЖ 50070 (6-136a) 
XC) =0 An AO (6-136b) 
其 中 
500) =1 MEDo j+m/2)/m>0 


BA=—1 MEE- jtm/2)/m<0 
将 未 知 干扰 谱 包 括 于 x(k) 中 , 重复 上 述 各 步 计算 ， 让 至 达到 稳定 ， 即 P(%) 阵 的 对 角 元 素 在 一 
段 计算 步骤 中 皆 为 很 小 ， 此 时 所 得 到 的 С) 即 为 所 求 。 

【讨论 】 

在 自 适应 Kalman 滤波 算法 中 , 误差 协 方差 阵 P Ck) 的 初始 值 的 选择 与 常规 Kalman 滤波 
算法 是 相同 的 。 在 自 适 应 Kalman 滤波 算法 中 ，P(A) 阵 的 计算 受 rO 的 影响 很 大 (参见 表 6- 
10 列 出 的 Kalman 增益 佑 计 式 和 误差 协 方差 阵 估 计 式 )。 当 模型 误差 很 小 时 ，r(A) 是 减 小 的 ， 
这 将 使 Kalman 增益 变 大 ， 从 而 导致 PC&) ERHALE h. HH r OO 值 直 接 与 模型 的 质量 
WK, 所 以 , 自 适应 滤波 的 POR) 阵 的 对 角 元 素 应 该 是 浓度 参数 最 终 估计 质量 好 坏 的 一 个 有 用 


指标 。 

自 适应 Kalman 滤波 算法 用 于 灰色 分 析 体系 的 解析 中 ， 存 在 阿 个 重要 的 先决 条 件 : © HB 
适应 Kalman 方法 用 于 分 析 时 , 在 开始 滤波 时 必须 有 一 段 过 程 校正 异型 是 正确 的 , 亦 即 在 这 一 
过 程 中 ， 每 一 个 已 知 存在 的 待 测 组 分 都 必须 有 响应 ， MATRA AM: SPA (6- 
131) 给 出 的 模型 错误 校正 项 只 有 当 背 景 干扰 是 一 单 组 分 时 .x(k),+1 就 是 该 组 分 的 量 测 矢量 ， 
但 是 ， 因 为 背景 干扰 一 般 来 说 很 难 确定 其 组 成 ， 所 以 ，x(&),- 一 般 只 能 看 成 是 未 包括 在 校正 
模型 的 整个 背景 干扰 的 量 测 系数 。 在 以 上 两 个 先决 条 件 中 ， 第 一 条 为 一 很 强 的 条 件 ， 这 是 因 
为 灰色 分 析 体 系 的 背景 干扰 实际 上 是 林 知 的 ,不 能 保证 在 开始 滤波 时 必须 有 一 段 过 程 校 止 模 
型 是 正确 的 ， 这 就 限制 了 该 算法 存 实际 中 应 用 。 

(四 ) 局 部 曲线 拟 合 法 

【基本 思路 】 

局 部 曲线 拟 合 法 由 Karstang 和 Kvalheim 提出 中 其 主要 思路 是 利用 背景 光谱 的 极 大 值 
来 进行 校正 ， 因 为 如 对 光谱 进行 微分 后 ， 背 景 光谱 的 级 大 值 处 将 为 零 ， 即 在 这 一 波长 点 上 背 
景 干扰 将 不 对 待 测 物 的 定量 测定 带 来 影响 ， 从 而 达到 消除 木 知 背景 干 抗 的 效果 。 问 题 是 因 背 
景 干扰 是 完全 未 知 的 ， 怎 样 通 过 已 知 条 件 来 正确 确定 背景 光谱 的 极 大 值 的 波长 位 置 将 是 该 法 
成 功 与 否 的 关键 。 

对 于 一 般 的 灰色 分 析 体 系 的 矢量 数学 模型 , 均 可 简化 为 以 下 只 含 一 个 待 测 分 析 物 的 情况 . 


即 

p=axitr' te (6-137) 
起 中 ,yy 为 全 未知 干扰 的 泥 合 物 光谱 量 测 矢量 ， x 为 待 测 分 析 物 的 标准 光谱 ,ci 为 该 待 测 分 析 
物 的 相对 浓度 ,rr 为 一 假设 的 未 知 干扰 的 量 测 光谱 。 必须 指出 的 是 , r 这 一 假设 的 未 知 干扰 的 
量 测 光 谱 实 际 上 是 其 他 的 待 测 物 的 量 测 矢 量 与 实际 未 知 背 景 十 扰 量 测 光 谱 矢 量 之 和 ， 即 

7 ex зг (6-138) 
这 样 ， 一 般 的 灰色 分 析 体系 的 数学 模型 就 转化 成 为 了 只 含 一 个 待 测 分 析 物 的 灰色 分 析 体 系 模 
型 。 这 样 的 变换 并 没有 改变 问题 的 实质 ， 了 可 以 通过 不 断 的 改变 不 同 的 分 析 物 以 达到 为 每 一 个 
待 测 组 分 定量 的 目的 。 下 面 对 只 含 一 个 待 测 分 析 物 的 情况 进行 讨论， 其 他 分 析 物 的 定量 可 完 
全 参照 此 例 同样 进行 。 

注意 到 ?是 一 个 量 测 光谱 矢量 ， 所 以 ， 它 是 一 个 波长 的 函数 ， 如 果 对 其 进行 波长 方向 的 

微分 ， 可 得 


dy/dÀ—cidx; /dÀ--dr' /dA (6-139) 
җир, dy/da= (dy, /dA, dy; /dÀ, * dy, /аА) зах ВА (д.с А dre /dÀ, оз) РА 
(dri /dA,dri/dA, s+ dm, /dA)' vm 是 量 测 光谱 的 波长 点 数 。 

设 在 假设 的 未 知 干扰 的 量 测 光 谱 存 在 有 一 个 极 大 点 , 沁 为 第 & 点 , 则 有 
dy,/da=c dz, /dAa—- dri дА (6-140) 
因 dri/dA 在 极 大 点 为 零 , 所 以 有 
a= (dy, /dA)/ (d>, / dÀ) ‹6-141) 
也 就 是 说 ,只 要 找到 了 未 知 干扰 的 量 测 光 谱 的 一 个 极 大 点 的 波长 位 置 ,就 可 利用 这 一 点 来 求 得 
待 测 物 的 相对 浓度 。 问 题 是 怎样 来 正确 估计 出 末 知 干扰 的 量 测 光谱 极 大 点 的 波长 位 置 。 该 法 
的 几何 意义 示 于 图 6-14。 


在 文献 2 中 ,Karstang 介绍 了 一 种 基于 


BET | 
同时 和 用 一 阶 导数 和 三 阶 导数 来 估计 未 知 干 | gaudes 
拢 的 量 测 光 谱 极 大 点 的 波长 位 置 方法 ,在 此 


将 介绍 一 种 基于 选 代目 标 因子 分 析 法 来 估计 
未 知 干扰 的 量 测 光谱 极 大 点 波长 位 置 的 方 I 


法 ,找到 这 个 极 大 点 后 , 继 用 式 (6-141) 即 可 
求 得 待 测 物 的 相对 浓度 。 的 
【基本 算法 】 
从 上 而 介绍 的 基本 思路 可 知 ， 局 部 曲线 
拟 合法 具体 可 由 以 下 步 又 来 实现 : 波长 
(OD Hx 构成 一 个 正 交 投影 矩阵 P. Heli 利用 -- 阶 导数 求 等 测 物 浓度 示意 图 
Р=(1—х\х\) (6-142) 


式 中 , 了 为 一 Оп Хт) BE, 

(2) 用 正 交 投影 矩阵 己 对 混合 物 量 测 光 谱 进行 投影 , 得 到 一 与 x 正 交 的 , 即 属于 x 矢量 
零 空间 的 -- 个 矢量 六 ， 该 矢量 已 将 x, 的 影响 全 部 扫除， 主要 反应 了 未 知 干扰 的 量 测 光 谱 的 
信息 ; 

Py =[1—хубх\х\) x]y 
= Gin) a eat) 
= [#—хубх\х) Mx Jr = y* 
(3) x, My ARTERY, РГУ, x]; SETTERS AE 
Y=USV'=UT' (6-143) 
ER T=. RRAS TREER, U WIA ATENE FP A eT 
办 进行 迭代 运算 : 
& Pay  k=1,2, 
r® =UU' r°) (6-144) 

在 每 次 迭代 时 ， 先 将 re- ”中 的 负 元 素 都 置 为 零 ， 然后 再 进行 投影 运算 ， 这 样 的 选 代 过 程 
HERA | Prt 站 小 于 某 一 给 定 值 。 这 样 欠 代 求 得 的 背景 矢量 将 会 很 靠近 真实 的 背 
景 , 此 时 ， 再 找到 该 背景 的 极 大 值 的 波长 位 置 . 用 式 (6-141) 来 求 得 待 测 分 析 物 的 相对 浓度 。 

#1] 

一 般 说 来 ， 该 法 求 出 的 待 测 分 析 物 的 相对 浓度 ， 在 背景 光谱 与 分 析 物 光谱 重合 度 不 大 时 
结果 将 与 实际 值 比 较 靠近 ， 因 此 时 背景 光谱 极 大 值 的 波长 位 置 估计 将 比较 准确 ， 然 而 ， 如 果 
背景 光谱 与 分 析 物 光谱 重 谷 度 很 大 时 结果 将 不 太 可 靠 了 .从 这 一 角度 来 看 , 虽 用 式 6-141) 可 
得 到 唯一 解 ， 但 背景 光谱 极 大 值 的 波长 位 置 估计 是 否 准 确 仍 受到 其 他 因素 的 制约 。 为 了 得 到 
较 精确 解 ， 一 般 需要 采用 内 插 法 来 求 真 正极 大 点 的 位 置 ， 实 因 极 大 点 的 位 置 可 能 实际 是 落 在 
两 个 量 测 波长 点 之 间 ， 这 也 是 为 什么 将 其 称 为 局 部 曲线 拟 合 方法 的 原因 。 综 上 所 述 ， 实 际 上 
此 法 仍 只 能 说 是 得 到 了 一 个 可 能 解 ， 真 正 得 到 严格 唯一 解 的 还 需 用 下 一 节 讨论 的 二 维 数据 的 
化 学 计量 学 方法 才能 得 到 。 


=, RIED 
从 上 几 节 的 讨论 中 可 以 看 到 ， 用 矢量 校正 模型 来 进行 灰色 分 析 体 系 的 解析 ， 都 存在 很 燥 
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的 先决 条 件 ， 如 果 这 些 先决 条 件 不 能 满足 ， 则 很 难保 证 求 得 的 解 是 有 物理 意义 的 真实 解 。 可 
以 认为 ， 这 样 的 困难 主要 是 来 自 对 未 知 干扰 背景 谱 知 之 其 少 ， 它 可 以 是 由 任意 的 很 多 未 知 干 
钴 所 组 成 ， 而 对 于 这 样 的 背景 干扰 我 们 又 根本 无 法 从 -个 矢量 中 确定 其 组 分 数 。 先 来 看 一 个 
最 简单 的 灰色 分 析 体 系 的 例子 , 即 在 这 样 的 灰色 分 析 体系 中 , 定性 已 知 的 待 测 组 分 只 有 一 个 ， 
数学 模型 为 


y=cu re (6-145) 
在 此 模型 中 , 代 求 的 参数 只 有 с. MR, 背景 干 


r 扰 量 测 谱 + 还 是 未 知 的 。 这 可 以 说 是 灰色 分 析 
体系 中 一 种 最 简单 的 情况 . 在 这 里 . 除 可 以 测 得 
а 该 混合 物 试 样 的 量 测 矢量 y( 包 括 矢量 的 方向 和 


长 度 ) 以 外 ， 还 可 得 到 待 测 物 的 标准 光谱 x, 的 
形状 ( 即 标准 谱 矢 量 的 方向 ), 实 因 x, ТЕ E MIN 
BA 6-15 不 同 竺 测 物 的 浓度 可 得 不 同 量 y 中 的 页 献 ( 即 标准 谱 矢 量 的 长 度 ) 应 由 < Ж 
FART ROAR ВА 确定 ,这 种 情况 的 几何 意义 可 由 图 6-15 Ж 
а. а. «ҮЙ Жк КНИГЕ; nor, WE Am. 
示 由 此 而 得 的 不 同 的 末 知 背景 干扰 光谱 矢量 它们 都 al EL cuir 
| 可 以 与 zt 很 好 地 拟 合 混合 物 光谱 y 从 图 615 ADAN, ат Таа 
ric, PHARM. o 和 又 互 为 函数 ,对 应 不 同 
LES 就 可 得 到 不 同 的 背景 干扰 量 测 谱 *, AAH o 和 r 芷 为 非 负 就 都 是 可 能 解 。 值 得 指出 
的 是 ， 在 这 种 情况 下 ,任何 拟 合 技术 都 是 没有 意义 的 ， 拟 合 度 的 好 坏 不 能 成 为 评价 结果 的 标 
准 ,图 6-16 给 出 了 -个 这 种 情况 的 具体 计算 机 模拟 例 了 , 从 图 
6-16 可 以 看 出 ， 随 着 c 的 变化 , 背景 干扰 谱 也 在 不 断 的 变化 。 
用 这 样 不 同 的 c, 和 r 都 可 以 把 混合 试 样 的 量 测 和 撩 量 y 拟 合 好 。 
如 果 和 采用 和 矩阵 类 型 的 数据 , 情况 将 发 生 显著 的 变化 。 对 于 
灰色 分 析 体 系 ， 和 矩阵 校正 的 数学 模型 可 由 式 (6-146) Xm; 
Y=cX,+cX,++c.X. + R+E (6-146) 
式 中 ,了 表示 混合 物 的 量 测 矩阵 《可 为 二 维 菊 光 光谱 或 色谱 联 
用 仪 产生 的 二 维 数据 ); X G=1, 2, =, n) 为 待 测 组 分 纯 物 
种 的 景 测 和 矩阵。 值得 提出 的 是 , X, G=1, 2, +. я) Ж 
的 矩阵 ， 一 般 为 双 线 性 矩阵 ， 即 它们 可 由 两 个 矢量 的 外 积 
表示 


X,—se (6-147) TN 
从 式 (6-147) 可 知 , XR 1, 二 维 荧光 光谱 或 色谱 联 用 仪 с^ 
产生 的 二 维 数 据 均 可 满足 这 一 条 件 。 和 矩阵 校正 的 数学 模型 中 
的 EE 为 量 测 误差 甜 阵 ， 一 般 仍 假设 为 服从 正 态 分 布 的 等 方差 
白 噪声 误差 ; 为 混合 体系 中 的 待 测 物 种 数 ，c; G1, 20, 图 6-16 AE 6-15 所 示 最 简单 
n) 为 未 知 待 估 参 数 , 一般 可 看 成 为 相对 浓度 ; R 为 未 知 背景 干 ”灰色 体系 的 计算 机 模拟 示例 
扰 和 矩阵 ， 它 亦 可 以 是 多 个 未 知 干扰 物 的 重 测 矩阵 的 线性 加 合 ，。 ЖЕНЕР eat 
BJ 


RdBobd.Bsted.B, (6 148) 
XB. BG=1, 2. =", m) APRA ИШЕН Pm ST DEED 1, 2. ns 


m) 为 干扰 物 的 相对 浓度 。 

双 线 性 矩阵 的 特点 , 即 纯 物 质 的 鞭 测 矩阵 的 秩 为 1, 而 背景 干扰 量 测 矩阵 的 秩 就 代表 它 的 
组 分 数 ， 也 就 是 这 一 特点 ， 使 得 灰色 分 析 体系 的 矩阵 校正 方法 成 为 近年 来 分 析 化 学 计量 学 研 
究 的 热点 和 难点 , 并 已 取得 较 大 的 成 果 , 其 中 著名 的 有 广义 秩 消失 因子 分 析 法 (GRAFA). Ж 
差 双 线性 分 解法 RBI)， 和 约束 背景 双 线 性 分 解法 “CBBL)、 从 纯 数学 的 角度 看 ， 内 为 二 维 
数据 提供 了 矩阵 秩 的 新 信息 ， 这 些 方法 一 般 此 可 给 出 有 物理 意义 的 唯一 解 。 当 然 ， 在 实际 应 
用 中 ， 还 存在 一 些 具体 困难 。 本 节 将 对 这 些 方法 的 基本 思路 和 基本 算法 作出 较 详 细 的 介绍 。 

(一 ) 秩 消失 因子 分 析 法 

【基本 思路 了 

秩 消 失 因子 分 析 法 首先 由 C. -N. Ho, Christian 和 Davidson 于 1978 年 针对 二 维 荧光 谱 的 
定量 分 析 让 提出 的 0w-:om。 该 方法 的 基本 原理 就 是 利用 纯 物 种 二 维 荧光 光谱 是 一 个 双 线 性 窟 
阵 ,上 且 其 秩 为 一 的 特点 来 进行 的 。 此 方法 的 基本 思路 为 设 已 测 得 被 分 析 物 的 纯 物 种 二 维 谱 ， 
将 其 作为 标准 ， 进 而 对 含 未 知 干扰 的 混合 体系 的 二 维 菊 光 光 溢 来 进行 消去 该 标准 的 运算 。 设 
未 进行 消去 运算 前 , 含 未 知 干扰 的 混合 体系 的 量 测 矩 阵 的 铁 为 ,那么 ， 当 被 消去 的 标准 正好 
等 于 其 存在 于 混合 体系 的 该 物种 的 浓度 大 小 时 ， 此 时 未 知 干 搞 的 混合 体系 的 量 测 矩阵 的 秩 就 
会 减少 一 而 成 为 (4 一 1)， 据 此 即 可 对 该 被 分 析 物 进行 定 甚 。 

设 合 未 知 干扰 的 混合 体系 的 量 测 矩 阵 为 Y, 不 失 一 般 性 ， 设 本 章 所 论 及 的 灰色 分 析 体 系 ， 
可 简化 为 如 下 的 数学 模型 : 


Y =X HRE 
=‹рд L R— E (6-149) 
即 先 只 考虑 其 中 一 个 感 兴趣 的 分 析 物 ， 而 把 其 他 分 析 物 也 都 归于 未 吞 干扰 。 这 样 的 简化 不 影 
响 一 般 性 的 原因 ， 是 因为 我 们 可 连续 地 将 不 同 的 分 析 物 当成 待 分 析 物 ， 直 至 所 有 的 分 析 物 都 
被 测定 。 式 中 ，X, 即 为 该 纯 物 种 双 线 性 的 量 测 簿 阵 ; р, 为 其 纯 物 质 蓝光 激发 谱 (对 于 色谱 联 
用 仪器 则 为 纯 物 种 色谱 ;而 @ 为 其 纯 物质 荧光 发 射 谱 ( 对 于 色谱 联 用 仪器 则 为 纯 物 种 的 相应 
光谱 ); ci 是 其 相对 浓度 ; R 为 未 知 背景 干扰 , 与 式 (6-146) 不 同 的 地 方 是 在 此 处 它 是 由 其 他 
分 析 物 即 多 个 未 知 干扰 物 的 量 测 矩阵 的 线性 加 合 而 成 ; 巨 为 二 维 数据 阵 的 莉 测 误差 矩阵 ,一 般 
仍 设 为 白喉 声 。 
首先 ， 考 察 一 下 秩 消 失 因 于 分 析 法 的 一 个 最 主要 方程 : 
F-Y—fX, (6-150) 
sth, X, 为 定性 已 知 的 与 X, 相对 应 的 待 测 分 析 物 的 标准 物 量 测 矩阵 ， 它 可 以 表示 为 
X.,=c,p.q; (6-151) 
为 以 后 讨论 方便 ， 还 假设 p. Mal DHA АЕ. ВИА Ура 106—1, 2, ө. ш). 
(在 此 co ЖИЙ Be B EK K RR TA АЖО 40—101, 2, s r), GERE 
vo 为 发 射 谱 的 量 测 波长 点 数 或 与 色谱 联 用 的 相应 光谱 的 量 测 波长 点 数 ); 秩 消失 因子 分 析 法 的 
主要 目的 就 在 于 找到 p, MRA 8=c co ATENE F HEIRE Y 的 秩 少 一 。 这 也 
就 是 秩 消失 因子 分 析 法 的 主要 思路 。 因 当时 计算 矩阵 秩 的 变化 还 不 十 分 容易 ， 故 5, -N. Но, 
Christian 和 Davidson 是 采用 一 种 选 代 方法 来 实现 这 一 计算 的 。 
【基本 算法 】 
CD 对 了 BRET ERAT ARANEO 
Y—USV' (6-182) 
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RP, U Si ECHR T Y RRA BTS AERPs Е ЕШ. VAERE Г УШ Е КЕКЕ HEROS D 
右 特征 矢量 ,一般 说 来 ，Y 矩阵 中 所 含 的 化 学 物种 数 为 多 少 就 得 收集 多 少 个 特征 矢量 。 如 设 
了 矩阵 中 所 售 的 化 学 物种 数 为 n+， 则 上 U 和 分 别 为 《wxXn) 和 (Xr) MER, 

了 矩阵 的 阶 数 是 由 激发 谱 的 量 测 波长 点 数 〈w) 和 发 射 谱 的 量 测 波长 点 数 G) 米 决定 的 ， 
所 以 ， 其 维 数 Cw Rr) 一 般 都 要 大 大 地 大 于 了 矩阵 中 所 含 的 化 学 物种 数 w。 

(2) aX (6-150) EXM FERE p 的 函数 ,所 以 , 秩 消失 因子 分 析 法 的 秩 运算 是 针对 
刁 和 矩阵 来 进行 的 。 然 而 , 因 下 第 阵 一 般 都 比较 大 , 故 几 C. -N. Ho, Christian 和 Davidson 提出 
的 秩 消 失 法 实际 上 是 针对 下 述 两 矩阵 来 进行 的 。 设 

G.=V'F'FV 


x 
G.=U FFU 

Ж, THERE F WERA w (ER r) 降 到 Y 矩阵 中 所 含 的 化 学 物种 数 Ca) 一 样 大 ， 从 而 

大 大 地 减少 了 计算 量 。 进 行 这 样 简化 是 有 理由 的 ， 这 是 因为 U SY 的 列 矢量 张 成 同一 线性 宰 

BJ, 而 号 与 y 的 行 矢量 张 成 同一 线性 空间 ,这 样 的 主 成 分 投影 降低 了 数据 的 维 数 ， 但 却 不 到 

失 任何 有 用 的 信息 。 

(3) 变化 式 (6-150) 中 的 8 之 值 , 变化 一 般 是 从 零 开 
始 向 正方 向 变化 。 对 不 同 的 8 计 算 G1 (或 G2) 矩阵 的 特 
TEE, 一 般 说 来 当 其 中 最 小 的 那个 特征 值 达到 和 极 小 ( 亦 即 
靠近 零 ) 时 ， 此 时 所 对 应 的 8 值 就 是 我 们 所 要 求 的 值 。 

(4) B5 8=су/с.. Tü с, 是 标准 物 的 量 测算 阵 的 相对 
浓度 ， 是 已 知 的 所以，c 就 等 于 fe. 

因 这 一 方法 巧妙 地 利用 了 二 维 数据 的 秩 的 信息 , 为 解 
决 分 析 化 学 中 灰色 体系 的 直接 快速 分 析 提 供 了 一 条 新 的 
途径 , 受到 了 化 学 计量 学 家 们 的 普遍 关注 ,并 将 其 拓 广 至 
联 用 色谱 二 维 数据 的 解析 22 。 利 用 该 法 来 求 得 8 的 过 
M 程 订 从 图 6-17 清楚 看 出 . 随 着 8 的 不 断 增 大 ,第 二 个 特征 
r 值 正好 在 o/c 点 处 出 现 一 个 极 小 值 说明 在 此 点 上 ， 和 矩阵 
" |! 的 秩 为 1， 然 而， 随 普 8 的 继续 增 大 ， 第 二 个 特征 值 又 回 
5 20 F, 说 明 此 时 矩阵 的 牧 又 回复 到 2. 

[讨论 】 
C.-N. Ho, Christian 和 Davidson 提出 秩 消 失 法 的 同 
HY, 还 提出 了 Bessel 不 等 式 的 概念 ， 以 检验 在 含 未 知 干扰 
Е AR RUSE тнага вв 
为 分 析 物 ， 另 一 个 为 未 知 干扰 物 。 有 必要 在 本 节 也 作出 介绍 。 
因为 U SY 的 列 矢量 张 成 同一 线性 空间 , 所以, p. 应 
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9-17. 作为 如 的 函数 之 第 一 特征 值 


пн Б ЖЕҢЕ, ЖЕШ 

p.= Мань (Sl n) (6-153) 
BE. BV 与 了 的 行 矢量 张 成 同一 线性 空间 ， 所 以 ，9, 应 可 由 VV SPRY A ЖЖ PESE. 
亦 即 


q—Xbu Slan (6-154) 


A, U 55 VRB, BI. U'U=I 8 VHT 成立， 所 以 


аг= шр. (k= Lian) (6-155a) 
k 
b=viq. (#=1,.n) (6-155b) 
MPa 1, so Bla (&=1, - л) 写成 矢量 的 形式 、 则 有 
a=U'p, (6-156a) 
及 
b=V'g, (6 156b) 
于 是 有 
Уай =a'a=pUU'p. (k-:1. s, m 
= Pips 
—YXA4-1 Gal, =" w) (6-157а) 


ER (6-157) ЕИБ = AL ГЕРЕ UU' 的 特性 , 即 UU p= p, 这 是 因为 Ж 
FEU GH, A VU'U =U, 这样 ,UU' 就 构成 了 一 个 包含 p RE EE CRUS t- 
É). ARADA] 的 条 件 ， 所 以 有 了 qi 一 ] 的 结论 成 立 ， 同 理 ， 因 为 


эы =Бъ= ФУУ. (1, +, m) 
—44. 
И) (6-157b) 


再 利用 并 中 =1 G-1.- 0 BK. WH MH) 结论 成 立 。 

ЕДТ RUal=1 WALK D. JU T MAH Bessel 不 等 式 。 

(Ma <1 (6-158) 

或 OD (6-158b) 
在 此 , WU 561 改 成 式 6-158) 两 不 等 式 ,其 理由 在 于 已 和 Y 只 是 取 了 主 成 分 , 没有 
将 量 测 误差 考虑 在 内 。 所 以 ， 在 化 学 量 测 的 实际 情况 中 ， 成 立 的 只 是 不 等 式 ， 因 为 在 实际 铺 
BUB, UU'p, 只 能 近似 的 等 于 poo 

根据 以 上 讨论 , 可 以 得 出 这 样 的 结论 , BL Ca R CLG) 越 是 靠近 1， 就 说 明 X, 的 确 
EES RA TR AY 之 中 。 利 用 Bessel 不 等 式 ， 可 检验 在 含 未 知 干扰 的 混合 
KAM EMERY 中 是 否 确实 含有 待 测 标准 物 。 

因 以 上 讨论 的 秩 消失 因子 分 析 法 实质 上 是 一 种 需要 多 次 或 迭代 的 算法 , 故 Lorber 对 此 方 
法 作出 了 改进 , 他 在 引 人 奇 异 值 分 解 算 法 的 基础 上 . 提出 一 种 非 选 代 式 的 秩 消失 因子 分 析 法 。 
Lorber 的 非 渤 代 式 的 秩 消 失 因 子 分 析 法 -的 主要 恩 路 就 是 将 以 上 讨论 的 秩 消失 因子 分 析 法 
转化 成 为 一 个 特征 方程 的 问题 ， 即 将 式 (6-150 转化 成 为 以 下 的 特征 方程 

X 'z=Az (6-159) 

的 形式 , 从 而 使 秩 消失 因子 分 析 法 的 计算 变 得 简单 明了 。 因 Lorber 的 非 选 代 方 法 实际 上 就 是 
广义 秩 消失 因子 分 析 法 的 第 一 种 情况 ， 此 方法 在 此 暂 不 作 介绍 ， 留 到 下 一 告 一 并 讨论 。 

(=) 广义 秩 消 失 因 于 分 析 法 

广义 秩 消 失 因子 分 析 法 是 由 Sanchez 和 Kowalsky 于 1986 ERRU, 其 主要 思路 是 将 秩 
消失 因子 的 计算 问题 转变 成 为 广义 特征 方程 求解 的 问题 ， 从 而 使 得 秩 消失 因子 分 析 法 不 再 局 
限于 一 次 只 能 测 一 个 待 测 分 析 物 的 约束 ， 此 外 ， 该 法 还 可 拓 广 至 其 他 类 型 的 情况 。 以 下 将 对 
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该 法 作出 详细 介绍 。 
【广义 秩 消失 因子 分 析 法 的 基本 公式 和 不 同 的 四 种 类 型 】 
任 -- 双 线性 数据 矩阵 了 ABEST. АТ M n A BET FE DUX FERREA РЕ X, 的 线性 组 合 , Вр 
Y —AX ЖАХ, БАХ, Е 
= Ар: + Agna: Ара E 


РАЈ (6 160) 
在 此 
P=[p opa" p, | (6-161) 
(À 0 0 зе 0 0 9^ 
: 0 À 0 0 0 9 
А= 1: i : : (6-162) 
| 0 0 0 A, © : 
bo 0 0 АЈ 
| 4\1 
4i; 
e=]: | (8-163) 
g- | 
| 4. | 


一 般 说 来 ,对 于 秩 消失 因子 分 析 法 存在 两 个 答 阵 ,一 个 是 含 末 知 于 扰 的 了 数据 第 阵 , 另 一 
个 则 是 含 定性 已 知 的 标准 分 析 物 的 了 矩阵 , 它 也 可 表 为 
X =ë X FEAR A te XE 
=F pai 4-р: +e ipg E 


EJ (6-164) 
式 中 
P=[p: pp] (6 165) 
& 0 0 0 0 0) 
0 & 0 0 0 0 
=|; d d E H i (6-166) 
0 0 0 0 &, 0 
0 0 0 о 0 & 
4] 
4i 
0= |: 
4-1 
q. 


H (6-160) 81 (6-164) Bist os AOS ÉE Y ЖП X UP EH ,可 实际 上 却 是 不 同 的 ,它们 不 同 的 
地 方 在 于 AGIS, Sanchez 和 Kowalski 将 它们 分 成 四 种 不 同情 况 来 分 别处 理 , 为 了 保持 该 方法 
的 原始 性 ,分 别 对 这 4 种 情况 进行 讨论 ,必要 时 对 它们 加 以 相应 的 说 明 ， 

COD 在 定性 已 知 的 标准 分 析 物 的 天 矩阵 中 只 有 一 种 物质 ,而 且 , 该 物种 是 含 森 知 干 扰 的 样 
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本 数据 矩阵 了 中 的 一 个 , 邵 
Diag (€) = (6,0, 0) 
Diag(A) — A Aa) QUID 
这 种 情况 也 就 是 在 前 一 节 外 所 讨论 的 那 种 情况 。 
O) 在 定性 已 知 的 标准 分 析 物 的 XX 矩阵 中 含有 几 种 物质 ， 南 且 ,这 些 物 种 都 存在 于 样本 
SOMA YP, BD 
Diag (6) = (6 ,S00) 
Diag(A) = (ААА) (Om 
这 种 情况 也 就 是 在 本 书 中 定义 的 灰色 分 析 体 系 的 一 般 情况 。 

QD 在 定性 已 知 的 标准 分 析 物 的 天 矩阵 中 含有 ?种 物质 , 但 是 ， 这 些 物 种 不 - 定 都 存在 

THEA BCR Yh, RI 
Diag (8) = (ie Spat de) 
Diag (A) = (А.е Any 0.0) Gn) 

这 种 情况 实质 上 相当 于 在 本 书 中 定义 的 白色 分 析 体系 的 一 种 特殊 情况 ， 即 校正 怎 阵 中 已 
包含 了 所 有 待 测 物 的 信息 ， 与 第 二 章 中 所 讨论 的 情况 约 为 不 同 之 点 在 于 此 时 还 多 包含 了 其 他 
化 学 物种 的 标准 谱 信息 ， 且 这 些 物 种 在 样本 量 测 矩阵 中 不 存在 ， 此 时 原则 上 是 可 采用 矢量 数 
据 的 校正 方法 来 直接 求解 的 ， 文 献 55 提供 了 几 种 可 能 解法 ， 有 兴趣 的 读者 可 参阅 这 些 文 
献 。 值 得 提出 的 是 ， 对 于 这 样 的 情况 ， 如 果 简 单 采用 多 元 线性 回归 的 方法 来 求解 的 话 ， 会 出 
现 负 浓度 值 的 问题 ， 而 使 最 小 二 乘 估计 结果 不 可 秀 。 一 般 说 来 ， 此 时 如 果 采 用 带 约 东 回归 分 
析 方 法 ， 即 约束 所 估 参 数值 《在 多元 校正 中 即 为 化 学 物种 的 浓度 值 》 不 为 负数 ， 这 样 即 可 直 
接 求 出 (71，…, А) 来 ,而 好 需 采用 本 节 将 要 介绍 的 需 采 用 二 维 数据 的 广义 特征 问题 的 求解 
方法 。 亦 即 采用 广义 秩 消 失 因 于 分 析 法 来 解决 此 类 问题 。 

С) 在 万 矩阵 中 含有 天 种 物质 , 但 是 , 这 些 物 种 不 一 定 都 存在 于 效 据 矩阵 了 中 , 而 且 , 在 
数据 矩阵 站 中 所 含 的 物种 也 不 一 定 都 存在 于 数据 矩阵 下 中 ， 即 

Diag (6) =(8,,. Snot .8,.0. 0) (а) 
Diag(A) = (0,+,0,Д yan) GOD 

这 种 情况 , AX 矩阵 本 身 还 包含 了 一 些 含 未 知 干 扰 样 本 中 不 存在 的 物种 ， 所 以 ， 很 难 把 
它 定义 为 前 三 种 情况 中 的 定性 已 知 的 标准 矩阵 , 同时 , Y p kayta TORAVT dE. 所 以 , 它 实 
质 上 应 相当 于 在 本 书 中 定义 的 黑色 分 析 体系 的 一 种 特殊 情况 。 值 得 指出 的 是 ，Sanchez 和 
Kowalski 提出 的 广义 秩 消失 因 于 分 析 法 确 可 对 此 求解 ,说明 广义 秩 消 失 因子 分 析 法 实质 上 是 
一 种 黑色 分 析 体系 的 解析 方法 ， 关 于 这 一 点 ， 将 在 讨论 广义 秩 消失 因子 分 析 法 的 具体 解法 中 
给 出 必要 说 明 。 关 于 广义 秩 消失 因子 分 析 法 解析 黑色 分 析 体 系 的 具体 算法 ， 将 在 第 四 节 详 细 
介绍 。 

HER УУРА, 和 式 Хә PEGC'， 对 此 两 方程 同时 右 乘 Q' My X3E Ot, Te 

PA=Y(QD* 和 PÉ—X(Qo»* 
PAE 二 PEA， 是 因为 4A 和 5 都 是 对 角 和 矩阵 ， 其 矩阵 乘法 是 可 以 交换 的 ， 所 以 可 得 


Y(Q')'E=X(Q')“A (6-167) 
4 (Q` =Z， 则 广义 秩 消失 因子 分 析 法 的 主要 方程 可 变 为 
XZA—YZE (6-168) 


对 于 上 述 方 程 , 已 知 多 和 5 而 且 也 测 得 了 YY， 所 以 要 求解 此 方程 ， 必 须 先 求 得 Z 和 4。 
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由 方程 《6-168)》 定义 的 问题 实质 上 就 相当 于 线性 代数 中 的 广义 特征 值 问题 (参见 第 十 一 章 )、 
对 于 广义 特征 值 , 目前 只 能 用 QZ 算法 求解 XZ 和 YZ 都 是 方 阵 的 情况 s BEL 对 于 它们 的 
求解 将 针对 不 同 的 情况 来 具体 进行 。 

【四 种 不 同类 型 的 算法 】 

L 广义 秩 消失 因子 分 析 法 对 第 一 种 情况 的 求解 方法 

首先 ， 按 式 (6-152) 对 样本 矩阵 了 进行 主 成 分 分 析 《奇异 值 分 解 )。 

这 样 ， 方 程 (6-168) ER 


XZA=USV'ZE (6-169) 
4 Z=VS'Z", sR, Z'—SV'Z, ВИЦ, 式 (6-169) TEX 
XVS^Z'A—USVZE-USVVS^Z'£—UZ'£ (6-170) 
上 述 椎 导 中 使 用 了 V 矩阵 的 正 交 性 质 ， 即 V'V=1， 再 对 式 (6-170) ZRU 得 
U'XVS UZ’ АЧ" 6=2°§ (6-171) 
继续 对 式 (6-171) ARA, np 
UXVS 'Z* AAT =U'XVS 27 А SY (6-172) 
亦 即 
К-У (6-173) 


xm, X'—UXVSU. Ask (6-172) MR (6-173) 可 以 看 出 ， HA E-168) RAKT MO 
征 值 问题 被 转换 为 一 般 特 征 值 问题 , 而 且 , X" 矩阵 还 是 一 个 方 阵 。 注 意 到 对 于 第 一 种 情况 , X 
是 一 个 秩 为 一 的 矩阵 , 所 以 "也 是 一 个 秩 等 于 1 的 矩阵 。 对 于 一 个 秩 关 1 的 矩阵 ， 其 唯一 的 
不 为 零 的 特征 值 就 是 这 个 矩阵 的 迹 ， 如 果 记 U'p. Na, 41У 为 5， 则 和 矩阵 六 "的 迹 可 表 为 
¥ =Trace(X* ) = TraceQU'XVS ^) (6.174) 
Fp EAT =. ARAN У=ё,/А, „ТЕҢ Y. 就 是 郑 个 唯一 的 不 为 零 的 特征 值 , 实 因 其 余 的 》 岁 
Bl £G—2, ,和 ) 为 零 而 全 为 零 。 所 以 , 求 得 7 后 ,就 立即 可 以 求 出 , 即 
而 一 名 /7 (6-175) 
这 也 就 是 要 求 的 含 未 知 干扰 样本 中 的 待 测 物 的 相对 浓度 。 
上 述 方法 也 就 是 Lorber 所 提出 的 非 选 代 式 秩 消失 因子 分 析 法 7。 
2. 广义 秩 消 失 因 于 分 析 法 对 第 二 种 情况 的 求解 方法 
这 种 情况 与 第 一 种 情况 的 不 同 之 点 就 在 子 校正 矩阵 包含 的 物种 数 ,第 一 种 情况 只 含 一 种 
物质 ,而 第 二 种 情况 是 含 多 种 物质 。 
同样 利用 式 (6-168) SE Ж ОРЫША Ж A Lu 


XZAA =XZ=YZEA'=YZB (6-176) 
即 
XZ=YzB (6-177) 
将 式 (6-152) 代 入 式 (6-177), 得 
令 XZ=USV'ZB (6-178) 
Z=vs-'z* 


这 样 ,Z" 二 SV'Z, 式 (6-178) 可 变 为 
XVS^Z' =USV'ZP=USVVS '"Z'B—UZ В (6-179) 


ЖГ (6-179) PREX ЖЖ UAB 
UXVS Z-—ZP (6-180) 


由 式 (6-180) 表 出 的 是 一 个 典型 的 特征 值 问题 ,与 第 一 种 情况 不 同 的 是 ,在 此 存在 有 m RS 
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АЖ—14ЕЖЕ ШЫЙ. BI CB sen Bu) T BREED EE — ЗЕ Ао КЕЕ 
用 到 相应 的 特征 向 量 , 利用 记得 的 特征 向 量 ,可 求 出 相应 的 p 和 g:, 即 相应 的 激发 与 发 射 光谱 
来 ,因为 

Z'=SV'Z=5V (O07) 


Q'= (VS Z: )* 
求 得 @ 后 ,不 难 求 出 相应 的 PAR. 因 了 = PAQ = USV'. BULL 
PA=Y(@')" =USV'VS Z'—UZ' (6-181) 


SORBET аин, P SOR KE T ob OTK ni REESE SR ER. BB 
分 辨 的 功效 , 关于 这 一 点 将 在 第 四 节 详细 讨论 ,另外 , 因为 ЕА, 所 以 求 得 了 B= (Guns 
8,2, 也 就 相当 于 求 得 了 一 系列 的 相对 浓度 的 比值 《1/4，… ELS 因为 Con 60 HH 
AGA ИЩ, (А, ty AD 就 很 容易 求 出 了 。 

3. 广义 秩 消 失 央 子 分 析 法 对 第 三 种 情况 的 求解 方法 

这 种 情况 与 第 二 种 情况 的 不 同 之 点 就 在 于 校正 矩阵 包含 的 物种 数 大 子 样本 数据 矩阵 包含 
的 物种 数 ， 此 时 如 果 将 于 和 了 的 位 置 对 换 一 仆 ， 即 此 时 是 对 区 而 不 是 对 了 进行 奇异 值 分 解 ， 
继 用 第 二 种 情况 的 解法 来 解 第 三 种 情况 ， 即 可 求 出 了 矩阵 各 组 分 的 相对 浓度 来 。 因 以 下 所 有 
求解 的 步骤 都 与 第 二 种 情况 一 样 ， 在 此 不 再 著述 。 

4. 广义 秩 消 失 因子 分 析 法 对 第 四 种 情况 的 求解 方法 

这 种 情况 是 一 种 特殊 情况 。 校正 矩阵 包含 的 物种 没 全 被 样本 矩阵 包含 物 种 所 包含 , 反之， 
样本 矩阵 包含 的 物种 也 没 全 被 校正 矩阵 所 合 物 种 所 包含 ,与 第 二 种 情况 和 第 三 种 情况 都 不 同 。 
为 使 一 个 矩阵 所 含 物种 能 包含 另 一 个 矩阵 的 全 部 物种 ， 所 采用 的 方法 是 ， 将 校正 矩阵 X 和 样 
ЖЕ ЖҮ HUM. 以 得 到 一 个 新 年 阵 M. 这样, 这 一 新 得 到 的 矩阵 MOT X Ж 
的 全 部 物种 又 包含 了 了 矩阵 的 全 部 物种 ， 用 第 二 种 情况 中 所 介绍 的 方法 即 可 求解 了 。 具 体 解 


法 如 下 : 
@ M=X+Y (6-182) 
@ 对 矩阵 M 进行 主 成 分 分 解 
M =U Su Vy (6-183) 
图 构造 以 M 害 阵 为 基底 的 特征 值 方程 ， 即 
OMY V Su Zi = Zá Ë (6-184) 
D RE Zi AWARE Р Ж 0° 
PEHA) =U uZh (6-185a) 
O= Qus Z4) (6-185b) 


【讨论 】 

对 子 广义 秩 消 失 因 子 分 析 法 用 于 套色 分 析 体 系 的 解析 ,第 一 种 和 第 二 种 情况 最 重要 ,其 他 
两 种 情况 只 是 第 二 种 情况 的 一 种 拓展 .另外 ,无 论 是 哪 种 情况 ,在 具体 求解 之 前 ，, 似 都 有 必要 进 
行 一 些 必要 的 检验 , 即 检验 要 求 的 分 析 物 起 否 确 实 存在 于 样本 和 矩阵 之 中 ,在 此 介绍 一 种 基于 投 
影 和 矩阵 的 简便 方法 。 当 然 ,用 前 一 节 所 讨论 的 Bessel 不 等 式 也 可 同样 进行 类 似 检 验 。 

在 讨论 灰色 分 析 体系 的 基于 矢量 校正 的 算法 中 ,我 们 曾 多 次 采用 过 投影 矩阵 (参见 第 十 一 
章 ) 来 进行 运算 ,这 是 因为 投影 短 阵 具有 式 (6-186) 所 示 的 性 质 。 

XX! x= xi ‹6-186) 
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Ab Хуков]. 

X (6.186) 的 物理 意义 为 : MR y CFA LP, ШШ X ROBE АХ 作用 于 
LZE nD, ЖЕПП Ж HEI RIQ HH r 是 否 确 实 包 含 十 某 一 泥 合 
ОАО Е ИЈАН РЕ х 之 中 。 投 影 也 可 以 通过 式 (6-187) 进行 ， 


UU'x,=x, (8-187) 
AF, U RAPE X PERI eS) 5 AACS EE, 
X=usvV' (6 188) 


xk (6-187) 之 所 以 成 立 ， 是 因为 
XX* =USV'USV')*+ =USV'VS Чл л (6-189) 
在 此 利用 了 UV 矩阵 的 正 交 性 质 , BLUU'U—U, 也 就 是 说 , U REU EAH. ER 
说 明 , 任 一 与 瑟 矩 阵 张 成 同一 线性 空间 或 包含 了 大手 阵 的 矩阵 来 进行 投影 操作 ,其 效果 与 直 
er X REPE FUR CHER РЕНО ВЕ, FR SAKA E BEAR BE 
进行 投影 的 情况 。 
设 X=PE@',， 且 X=USV'， 
则 有 UU'XVV'-- X (6-190) 
这 是 因为 , UU'X—UU'P$Q'= PEQ' . 在 此 利用 了 UU'P— P. RAU 与 P 构 成 的 是 同一 个 线 
Ж]; FM, XVV' 一 PQ'VV' 二 PE5Q', 这 是 因为 了 与 Q' 构成 的 是 同一 个 线性 空间 ,结合 以 上 
讨论 的 两 点 ， 可 得 


UU'XVV'= UU P)EO'VV) = РЕ =X (6-191) 

ГУНА ТАКИ НА, WU DOE FP ET ЯН GE S CERE 
用 数据 的 定量 分 析 P aa。 

(三 ) 残 差 双 线 性 分 解法 

【基本 思路 】 

残 差 双 线性 分 解法 由 Ohman, Geladi 和 Wold 共同 提出 :2 -22 ,其 基本 思路 仍 是 利用 双 线 
性 纯 组 分 矩阵 秩 为 一 的 基本 原理 ,先是 把 含 未 知 干扰 的 样本 矩阵 按 式 (6-146) 所 示 那 样 分 成 两 
部 分 ,一 部 分 为 待 测 的 分 析 物 (X,,i 一 1,2,… ,n), 另 一 部 分 为 未 知 干 扰 背 景 R, 继 交 蔡 对 数据 进 
行 两 步 分 析 , 首 先 在 加 定 背景 的 基础 上 对 分 析 物 进行 校正 ;然后 固定 得 到 校正 的 分 析 物 相对 浓 
度 , 对 干扰 背景 进行 主 成 分 分 解 ,经 不 断交 蔡 进 行 上 述 两 个 过 程 ,直至 背景 干扰 的 分 解 可 在 已 
知 主 成 分 数 的 基础 上 完全 分 解 , 且 校 正 的 分 析 物 相对 浓度 达到 收 化 。 这 -- 算 法 的 提出 ,为 灰色 
分 析 体 系 的 直接 解析 又 提供 了 一 种 新 思路 ,在 本 节 将 对 这 一 算法 给 出 详细 的 介绍 。 

对 于 式 (6-146) 所 示 的 灰色 分 析 体 系数 学 模型 .如 直接 采用 第 二 节 所 述 方法 进行 校正 ,由 
РТИ RR 的 存在 ， 所 得 校正 结果 必然 是 不 佳 的 ,然而 如 果 利 用 双 线 性 纯 组 分 矩阵 秩 
为 一 的 条 件 ， 经 过 对 样本 矩阵 的 秩 分 析 ， 就 可 预先 知道 该 含 未 知 干扰 的 样本 算 阵 中 含有 多少 
物种 ，、 从 而 也 可 算得 在 R 矩阵 中 所 售 的 物种 数 。R 矩阵 中 所 含 的 物种 数 〈 或 称 玉 矩阵 的 主 成 
BHO), 是 一 个 非常 重要 的 信息 , 由 就 是 有 了 这 样 的 一 个 重要 信息 , 才 使 得 灰色 分 析 体系 的 唯 
一 解 成 为 可 能 . 残 差 双 线性 分 解法 的 目标 就 在 于 , 在 给 定 的 含 未 知 干扰 样本 矩阵 Y, REER 
X, G=1, ne n, ЦИТ ВЕРЕН АТО OM m 的 前 提 下 ， 来 正确 估计 式 中 的 c 
G= 


эон), 
【基本 算法 】 
残 差 双 线 性 分 解 的 基本 算法 ， 按 以 下 步骤 进行 
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OO ABA X G=1, +, D 对 样本 矩阵 了 进行 校 止 ， 得 G= l, зе, m) 

(2) 对 He Xi? X +". +с®°Х) HEAT ERLE SNR, JERR AT m 个 主 成 分 构成 背 
ETRE, BH RO SUV, ХЕ UO VOW ER TAT m 个 因子 得 分 与 因子 荷载 。 

(3) 对 于 =1,， 2, өөө > HIT FER 

(D i£ (У- ОФУ), JEB X; G=1, =, n) OW (Y Ut V» 进行 校正 . 得 
d? G—1., +, n); 

D H (уа? HPX H --, EG XO 进行 主 戌 分 分 解 ， 并 取 前 m 个 主 成 分 构成 背景 
FRR, HD REP RUE PV, 在 此 4+D 和 V4'M 为 主 成 分 分 解 前 m 个 因子 得 分 与 因子 
荷载 。 

CD 计算 PAP X EP Xi, ors HAPU ny!) 的 方差 ,如 果 它 们 大 于 量 测 误 
差 方差 则 转向 中 继续 迭代 ， 和 将 则 ， 停 止 迁 代 。 

【讨论 3 

以 上 算法 只 能 说 是 残 差 双 线性 分 解法 的 基本 算法 ， 实 因 其 原始 算法 中 的 一 个 加 速 过 程 在 
本 节 中 没有 给 出 介绍 。 这 是 因为 本 书 作者 认为 该 加 速 过 程 蔓 有 一 定 功 数 ， 但 却 有 失 和 烦琐 和 干 
扰 对 主要 算法 的 理解 ， 所 以 在 此 省 略 ， 读 者 可 直接 参阅 文献 0221 。 

另外 ， 对 于 第 一 步 和 迭代 过 程 中 的 第 中 步 ， 我 们 也 没有 给 出 具体 的 方法 ， 原 则 上 ， 就 可 
简单 地 采用 第 三 章 中 介绍 的 直接 校正 方法 ， 即 MLR 方法 ， 来 计算 就 可 以 了 。 当 然 用 PLS 方 
法 也 是 可 行 的 ,在 残 差 双 线性 分 解法 原始 文献 中 就 是 采用 PLS 来 进行 校正 的 , 有 兴趣 的 读者 
可 直接 参阅 文献 "” 。 

Ohman, Geladi 和 Wold 将 上 述 讨论 的 残 差 双 线 性 分 解法 用 于 联 用 色谱 CHPLC-DADO Ж 
HORT. 并 与 广义 秩 消失 因子 分 析 法 进行 了 比较 研究 ， 所 得 的 结果 永 于 表 6-11. 


#611 残 差 双 线性 分 解法 与 广义 秩 消 失 因 于 分 析 法 解析 结果 的 孔 测 误差 比较 表 


E 本 组 RO RBL GRAFA 
序号 

A B c D A B A B 
1 2 2 0 ° 0.053 0.036 0. 049 0. 460 
2 2 2 0 o 0.022 0.030 —1. 253 — 1.435 
3 2 2 о ° - 0.008 -0. 003 --0. 722 0.267 
4 2 2 o ° 0.020 0.064 0.022 —1.077 
5 2 D ° 0 一 0. 313 0.007 9. 10 —0. 145 
6 2 0 2 0 —0. 030 0.007 —0. 282 —0. 395 
7 2 ° 0 2 9.122 —0. 145 0. 165 —0. 180 
8 2 o 2 z 9.147 9.090 0. 295 9.907 
9 0 2 0 0 一 0.018 0.057 一 0.015 0.095 
10 0 2 2 o —0.004 0.064 —0. 020 0, 185 
11 ° 2 ° 2 — 0. 002 —0.116 — 0. 022 一 0. 152 
12 ° 2 2 2 0.003 0.046 一 0. 202 —0. 040 
13 z z 2 ° — 0.012 — 0.068 —9.337 3.587 
м 2 2 0 2 —0.285 —0.181 —0.285 一 0.852 
15 2 z 2 2 —0.169 ~ 0.339 一 608 —0. 690 
16 1 о 3 3 一 0. 043 0.099 — 0.150 一 0.325 
17 о 1 3 0.041 0.178 —9.170 0.0 
18 3 ° 1 1 —0. 059 —0. 744 | 9.05 — 9.115 
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BR 
| Rok 组 成 9 RBL T GRAFA 
rs | 一- +—— -一 
A в с р А B A B 

19 ° з 1 1 1.53 Uno Troas 2.017 

20 2 2 2 2 | - 9.196 0.411 ; — 0.08; 0. 372 

д 2 2 2 2 | 0060 0.047 = 0.514 = 1. 168 

22 2 2 2 2 | от 0.284 EX -9. 785 

23 0 9 2 0 —0,075% -0. 100 — 0. 060 —0.017 

24 ° o 0 2 -0.0]4 9.035 | —%?% —127 

O A PAs Aw BATH: сяра, ЖМК НА Ka: 

А XB BOER: CREM: D- TR-N. 
在 残 差 双 线 性 分 解法 的 原始 文献 中 ， 该 文 的 作者 还 对 算法 中 的 第 三 步 的 迭代 过 程 的 收 全 


给 出 了 一 个 证 明 ， 因 本 书 作者 认为 该 证 明 将 对 此 法 的 理解 很 有 帮助 ， 所 以 ， 也 将 在 下 面 给 出 
介绍 。 
在 第 三 步 的 兴 代 过 程 中 ， 我 们 不 断 地 更 新 < G1, +, UH y, 每 一 次 更 新 就 
相当 于 一 次 新 的 通 近 ， 这 样 就 有 
[=E | | y Xe? x cu^ v | (6-192) 
在 此 给 出 证 明 如 下 : 
因为 etG 二 1,…,0) 是 从 对 位 一 VV) 进行 基于 最 小 二 乘 最 优 意 义 的 校正 所 得 ,在 这 
一 点 上 ,MLR 和 PLS 是 等 同 的 ) ,所 以 有 
пу усех —UOV | <| y— EX vov | (6-193) 
Җир, Gade es, m) 为 任 一 其 他 可 能 非 最 小 二 乘 意义 的 合计 或 包括 i Gsl = n) 在 
内 的 任意 估计 。 另 一 方面 ，Der2 和 Ye 为 On EPOD 的 主 成 分 分 解 所 得 的 前 mw 个 因 于 
得 分 与 因子 荷载 , 所 以 , 从 最 小 二 秉 意义 上 来 说 ， 〈 实 因 主 成 分 分 析 亦 为 一 基于 最 小 二 乘 原理 
的 方法 )， 有 


LY- EPUA |< | Y— eX, HG' | 
= [| Y-Xc?x,-Uv" || (6-194) 
因为 式 (6-194) P H fl G 为 任意 其 他 矩阵 的 前 m FRAT n He BRUM VORA. 

(四 ) 约束 背景 双 线 性 分 解法 

【基本 思路 】 

从 上 一 - 节 的 讨论 可 以 看 到 , 残 差 双 线性 分 解法 实质 上 相当 于 一 个 不 断 副 近 过 程 ЖЕШ 
ЖЕҢЕ HS AHEAD RO URGE AT Y ЖЕЙ ER ЧА REIME- T E bs RC CY — 
Ух, UV) ,使 其 达到 量 测 噪 声 水 平 。 所 以 , 残 差 双 线性 分 解法 有 可 能 转化 成 一 优化 问题 。 

JU. 来 具体 考察 一 下 灰色 分 析 体 系 的 数学 模型 L (6-146)J; 

Y=c.X,+c X; , ty beet RE 
MR (6-146) 可 以 看 到 ， 这 里 已 知 量 是 样本 量 测 矩 阵 Y MERER X GS, +, п), 另 一 方 
面 ， 伏 还 可 得 到 一 个 隐 侣 在 纯 组 分 量 测 矩 阵 都 是 双 线 性 矩阵 之 假设 下 的 一 个 已 知 量 。 可 以 预 
ARH YEE RRI Y 矩阵 的 秩 减 去 待 测 组 分 数目 ， 又 可 得 未 知 干扰 背景 矩阵 的 
ж Нат REPT SA REC. 注意 到 这 一 信息 是 一 非常 重要 的 信息 ， 
也 就 是 利用 了 这 一 信息 ， 才 使 双 线性 二 维 数据 的 灰色 分 析 体 系 的 解 桥 可 得 到 有 物理 意义 的 唯 
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一 解 。 
利用 样本 量 测 挎 阵 Y、 校 正 矩阵 X, G=1, +. n) 和 未 知 干扰 背景 矩阵 的 秩 这 些 已 知 条 
件 , Ја, Manne # Kvalheim 将 灰色 分 析 体系 的 解析 咎 题 转化 成 为 一 个 优化 问题 ， 提 出 了 
约束 背景 双 线 性 分 解法 中。 现 将 该 法 的 基本 思路 介绍 如 下 。 

将 灰色 分 析 体 系 的 数学 模型 改写 成 为 

Y =УсХ,+К+Е 
= Усх Н Day tE (=l, +, mi J=1, oe, m) (6-195) 

KP. ш, Aly, G=1, os m) 分 别 为 对 及 矩阵 进行 主 成 分 分 析 所 得 的 因子 得 分 和 因子 载荷 。 
AR 06-195) TBH. BEA с, MR. (i 二 1，… ,nn) 的 估计 不 正确 ， 过 高 或 过 低 ， 
部 将 使 (y— Усх) 中 还 包含 了 校正 矩阵 X, (i 二 1，…，n) 的 信息 ， 这 就 导致 不 可 能 只 用 m 
TERTI R EBE, ЖШ Q— XoXo 矩阵 进行 完全 分 解 ， 也 就 是 涪 ， 此 时 (Y— УХ. 
Lav) FS T RORY X G= 1, +, n) 的 信息 ， 当 然 ， 其 方差 也 就 大 于 量 测 误 差 了 。 
当 且 仅 当 ww 一 1，…， n) 被 正确 估计 时 , 才能 用 汶 个 主因 子 对 (了 一 本 cX,) SE Eel SE T 
解 .也 只 有 此 时 (y— 3X, Уини) 的 方差 才 与 量 测 误差 相当 。 这 样 由 式 (6-195) 所 定义 的 
灰色 分 析 体 系 的 定量 校正 问题 就 转化 成 为 一 个 以 了 -- eX 一 uv ?为 目标 函数 的 一 个 优 
化 问题 。 凤 在 给 定 的 和 (1 一 1，…,w) Hom 的 条 件 下 ， 对 c(i 二 1，-…，n》 Blei EG SHE. 
HERRA Y- ZX Duv, | KAUR, GSi, e n) 的 估计 即 为 要 寻找 的 待 测 物 
的 相对 浓度 。 

如 果 对 c(i 二 1，…，n) 估计 的 寻 优 需 在 (一 co， 十 ) 全 空间 进行 搜索 的 话 ， 这 一 最 优 
化 问题 的 求解 仍 不 是 一 件 易 事 。 幸 而 在 此 要 求 的 是 相对 浓度 ， 它 们 不 可 能 为 负数 。 利 用 一 些 
AC RARE. 可 以 把 寻 优 搜索 空间 约束 在 一 个 (0, а) 空间 中 进行 ,这 也 是 为 什么 称 之 为 约 
束 背 景 双 线 性 分 解法 的 原因 。 

【基本 算法 】 

l. «Gol. or, n) 估计 的 约束 界 

因 要 求 的 是 相对 浓度 值 ， 所 以 ， 它 们 不 可 能 为 负数 ， 即 


CGO Gol. 


此 为 c(i=:1,…,n) 估 计 的 下 界 。 

另外 ,利于 光谱 量 测 值 不 为 负 的 约束 ， 即 光谱 的 量 测 值 КЖ Xw 不 可 能 为 负 的 条 件 ， 我 
TAFE 01, s п) 估计 的 上 界 。 ТЕҢ, А Xu) ERES. RA X; ИЖ k ff 
LEE p T 

设 量 测 误差 矩阵 中 的 所 有 元 素 E, (&=1, n. w j=l, "r" r) 的 绝对 值 都 小 于 某 一 常 
žo Bp 


lEs [SE 
因为 最 测 值 Ru 不 可 能 为 负 ， 所 以 有 
Ru=Y,— DeXw EE (6-196a) 
或 
Xc X, Ү,+Е (6-196b) 


М, Юс 和 X. XS EE 
а= OX styl Xu Se PK ty! X. SV EE) /Xs (6-197) 
REY By, WPA 1, сз, ws j=l, es rs 
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exXMax(c) =Min[(Y,, T E) /X,,] Gol, (6-198) 
HER ¿220 和 式 (6-198) 连 起 来 ,就 得 到 了 浓度 估计 的 约束 界 。 
2. 背景 干扰 矩阵 的 秩 估计 
因为 了 矩阵 的 秩 减 去 待 测 组 分 数目 就 可 得 未 知 干扰 背景 矩阵 的 秩 , 即 
m=rank(R)=rank(Y¥)—x (6-199) 
所 以 ， 正 确 佑 计 了 和 抢 阵 的 秩 也 是 本 法 能 否 成 功 的 一 个 关键 。 估 计 和 矩阵 的 秩 的 方法 很 多 ， 但 大 
多 是 基于 主 成 分 分 析 的 方法 来 完成 的 ， 有 关 这 一 点 将 在 第 四 季 详 细 讨 论 . 另外 ， 如 果 m 等 于 
零 ， 这 说 明 玉 矩阵 实际 不 存在 ， 此 时 即 可 直接 采用 白色 分 析 体 系 的 解析 方法 来 进行 解析 了 。 
3. 优化 方法 
在 目标 函数 Пу X2 X — Lavi |p, ш, Aly, {ШЕ с, G=1, +, n) 的 函数 , A u Ay, 
Бава, NAR BRABOR ILE PARE. MA, RRAS 
需 依靠 求 导 的 优化 方法 ,如 单纯 形 优化 方法 "或 Powel Jj 1850757. 因此 同 题 是 一 个 约束 优 
化 问题 ， 如 采用 单纯 形 优化 方法 须 在 每 步 都 计算 一 次 边界 条 件 ， 所 以 在 文献 中 是 采用 
Powell 方法 来 进行 的 。 具 体 算法 步骤 如 下 : 
QD 选择 一 个 落 在 约束 区 间 的 初始 估计 浓度 矢量 点 = (c c es, с) 和 尾 一 组 张 成 约 


FREER (ts р, е, у”), 
@ в=1. 2, 3, = 
图 ;从 1 到 = 计算 
emen ny (6-200) 
在 此 8*" 使 下 列 包 含 8 的 函数 取得 极 小 值 ， 
$00 = f(et' FO" pty) (6-201) 


O 令 下 一 (er 一 /eo 一 er", 并且 计 算 
Ce 
在 此 9"+! 使 下 列 包 含 8 的 函数 取得 极 小 值 ， 
$00 — f ("F0 aav) 
OSE EIE A 
A,—max[ f ("7 uv D f uv] 
在 此 ,下 标 z OR ARER = 步 获得 的 极 大 值 ,1] 委 rs"。 
@ 如 果 
Je! | [fA Gur D РС музи DIA 
WA. 18 n, > 
унум 
并 转向 第 信步, 否则 令 
з=" (j—1,2,.3—1) 
yim! Goat lyn) 
yim уне 
KROL 
@ 如 采 
FG aus D/GoXr—mx2XE€ 


或 者 是 ,对 于 i 一 1,2,… ,n, 都 有 
171—000, 0005 

WELEHE, EWG 4 一 上 1， 转向 第 加 步 。 

由 上 式 给 出 的 0. 0005 是 一 个 终止 指标 ， 即 如 果 前 后 两 次 迭代 的 请 度 差 值 小 于 0. 0005 时 
则 认为 已 达到 要 求 ， 这 是 因为 我 们 认为 紫外 可 见 光谱 最 多 能 达到 量 测 精 度 ， 对 于 不 同 的 分 析 
仪器 ， 应 该 有 不 同 的 终止 指标 。 该 算法 的 第 @ 步 到 第 回 步 是 保证 搜索 方向 (v, v, onn, 
vi") 总 能 线性 无 关 0 中 ,另外 , 在 上 述 算法 的 第 命 和 第 加 步 的 一 维 搜索 优化 算法 在 本 文 是 采用 
T 0.618 法 ， 或 称 黄金 分 割 法 来 进行 的 。 

4. 优化 搜索 区 间 的 确定 

上 述 讨论 的 Powell 方法 实质 上 是 一 种 无 约束 优化 方法 ,在 优化 过 程 中 ， 只 给 出 了 优化 的 
方向 而 没有 给 出 优化 搜索 的 区 间 ， 在 此 将 对 优化 的 搜索 区 间 的 确定 进行 必要 的 讨论 。 

对 于 给 定 的 初始 矢量 e° 和 寻 优 搜索 方向 v"， 由 此 可 以 构成 一 个 直线 方程 

ё+8»=с (6-202) 

式 中 ,8 就 是 我 们 要 确定 的 一 个 实数 , 确定 了 8 的 变化 区 间 也 就 等 于 确定 了 优化 的 搜索 区 间 。 
实际 上 ， 搜索 区 间 是 由 式 (6-203) 决定 的 。 


Oszcesmax(o) (一 1 2 (6-203) 
将 式 (6-202) 代 人 式 (6-203), 则 有 
Ос! Волах (с) 0120 (6-204) 


这 样 ,对 于 c 矢量 的 每 一 个 元 素 ,8 都 可 以 找到 一 对 边界 。 现 分 三 种 不 闻 情 况 吉 以 讨论 : 
D žu КРАН, 


о/о В (тах ledi) G= 1200 on) (6-205a) 

@ щъ Рен, 
et foe BS (тах (z) — с) /wo (= 142400 2) (6-205b) 

@4v 等 于 零 时 ， 
OszB«max() (G—1,2, n) (6-205c) 


由 上 述 式 (6-205) 确 定 的 是 -- 组 边界 ,对 于 
下 界 应 取 其 中 的 最 大 值 ,但 对 于 上 界 则 应 取 其 
最 小 值 。 确 定 寻 优 搜索 边界 的 几何 意义 示 于 图 ae ers пажа) 
6-18, 

在 这 里 的 初始 矢量 с 是 一 个 具有 要 对 意 
义 的 初始 矢量 2， 即 每 一 个 方向 所 得 到 的 最 优 


Ne DEA 
点 实际 上 就 是 下 一 次 搜索 中 的 初始 矢量 。 20 | 


ca =Max(es) 


[讨论 ] 
约束 背景 双 线性 分 解法 实质 上 是 把 灰色 分 图 6-18 ”确定 寻 优 搜索 边界 的 几何 示意 图 
析 体 系 的 校正 问题 转换 成 为 一 个 约束 优化 问 faa EJEA бы ЕК 


题 。 前 一 节 讨论 的 残 差 双 线性 分 解法 实质 上 也 相当 于 一 个 不 断 优化 逼近 过 程 ЖЖ. W 
法 是 通过 交替 调整 待 测 分 析 物 的 浓 度 居 计 值 和 干扰 背景 的 主 成 分 估计 来 不 断 表 近 的 ,而 且 , 此 
表 近 过 程 的 初始 点 就 是 不 考虑 背景 干扰 的 简单 对 校正 矩阵 的 回归 结果 ， 可 以 想象 ， 如 果 背 景 
干扰 严重 时 , 此 点 离 真实 最 优点 是 很 远 的 ,如果 在 交 蔡 逼近 过 程 中 存在 着 局 部 最 优点 的 话 ,就 
有 可 能 落 入 局 部 最 优 的 危险 , 这 一 点 从 表 6-11 所 列 的 结果 似乎 也 可 以 看 出 。 残 差 双 线 性 分 解 
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法 的 结果 除 少数 几 个 外 一 般 都 比较 好 , 只 有 第 32 SER, 这 就 有 可 能 是 落 人 了 
局 部 最 优 ， 不 然 ， 此 结果 无 法 解释 ， 由 式 (6-194) 给 出 的 着 近 过 程 总 是 会 使 目标 随 数 (Y 一 


波长 (a) 保留 时 间 


图 6-19 模拟 体系 的 纯 组 分 色谱 和 光谱 图 


Усх, -UVO 不 断 变 小 的 . 所 以 此 解 只 可 能 
是 局 部 最 优 解 ， 即 虽然 此 解 离 真实 解 很 过。 
HERRAR (Y - Усх, -UVO 的 值 在 该 领 
域 可 能 却 是 最 小 的 。 

SPR AT REDER IE Se A B9 Е Яг 
解 的 情况 ,我们 对 其 进行 了 计算 机 模拟 实 
0. 图 6-19 示 出 了 模拟 双 线性 体系 的 色谱 
和 光谱 图 。 表 6-12 给 出 了 两 种 方法 的 计算 
结果 进一步 证 实 这 -结论 ， 我 们 算出 了 
(a) (b) (c> (d) 四 个 体系 的 响应 曲面 CA 
见 图 6 20). 从 图 6-20 可 以 看 出 ,此 响应 曲 
HAVRE. 如 初始 点 远离 真实 解 时 , 是 有 
可 能 落 入 局 部 最 优 的 。 

虽然 约 末 背景 双 线 性 分 解法 是 用 浓度 
估计 的 约束 来 减 小 落 人 局 部 最 优 的 危险 ， 
得 是 ， 因 该 法 在 此 使 用 的 Powell 算法 仍 是 
一 个 局 部 最 优 方法 ， 所 以 还 不 能 保证 对 任 
何 情况 都 不 沙 人 局 部 最 优 。 随 着 化 学 计量 
学 的 深入 研究 ， 近 年 来 出 现 了 几 个 全 局 最 
优 算法 ,著名 的 有 模 氢 退火 -和 遗传 算 


HUMO, 谢 玉 正 等 用 模拟 退火 方法 研究 了 约束 背景 双 线 性 分 解法 的 局 部 最 优 情况 1, 最近， 
陈 文 册 等 也 用 遗传 算法 对 此 进行 了 类 似 研究 i， 均 得 到 满意 结果 . 


R612 图 6-19 所 示 模拟 体系 的 残 差 双 线性 分 解法 (RBL) 
与 约束 背景 双 线 性 分 解法 ‘CBBL) 结果 比较 


分 析 体 系 | 分 析 物 | KAFR REL 估计 CBBL 估计 

a 1.2 3 4 0.9998 1.002 0. 9999 1.00004 
1,3 2.4 0.9995 1.002 1. 0001 1.0003 
2,3 1,4 1.0003 1.0003 с. 99996 0. 99997 
1,4 2.3 1.0004 1.0003 1. 0000 0. 99999 

b 1,2 3.4 0.9999 1.003 0.99997 1.0000 
1.3 2,4 0. 9995 1.004 1. 0000 1. 0000 
2,3 1.4 0. 9998 1.015 0.99997 1. 0000 
1.4 2,3 0. 9982 1.003 | 1.0000 1.0000 

с 1,2 3 4 0.9998 1.002 | 0.99999 1. 00004 
1 8 2,4 2.026 1.041 | 1.0001 1.003 
2,8 1,4 0.9993 1.008 0, 99996 0.99997 
2.04 1,2 2.818 1.1002 1.0000 0. 99999 

а 1,2 3, 4 1.006 1.925 1.0000 1.0003 
1,3 2.4 0. 9869 1.138 i 1. 0000 1.0003 
2,3 1,4 1.024 0.9835 0.99996 0.99997 
1,4 2. 8 1.558 1.090 1.06000 1. 00004 
2,4 1,3 1.146 0. 9635 1. 0002 9. 99992 
35, 4 1,2 2. 088 1.111 0. 9997 1. 00008 


D dep RASS W HH 6-19 给 出 。 
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6.0 
(e) 


图 6-20 JL. BUTLER E BJ mi i Bi АПЫ 


JA E BEIT AR CE A Wir ЖЖ URB BE BE TE 88 SH phe ЧЕ ЕГИ ORF PE n А 
SPRL OR, ATER. TE ELMO Ra ЖЕН. HI. dE 
SHERMER EME. SEES EAE AUGE SRE. REA RE EE 
的 正确 估计 ， 然而， 在 实际 数据 中 实现 这 一 点 却 很 不 容易 ， 尤 其 是 当 样 本 中 的 未 知 背景 干扰 
比较 复杂 时 更 是 如 此 ， 实 因 在 矩阵 秩 估 计 中 ， 影 响 因素 很 多 ， 如 纯 组 分 波谱 的 重 又 程度， 组 
分 数目 ， 纯 组 分 之 间 浓 度 的 相对 比例 ， 噪 声 的 形状 〈 如 等 方差 噪声 与 非 等 方差 噪声 ) 等 都 直 
接 影响 矩阵 秩 的 正确 估计 ， 从 这 -角度 来 说 ， 本 章 所 讨论 的 灰色 分 析 体 系 的 校正 方法 对 于 过 
于 复杂 的 体系 直接 解析 还 存在 一 些 问 题 ， 不 能 认为 上 述 方法 对 于 任 一 灰色 分 析 体 系 均 可 得 到 
很 准确 的 唯一 解 ， 是 随 样 本 的 复杂 程度 而 变化 的 。 其 次 ， 对 于 上 述 方 法 应 用 于 分 析 化 学 的 实 
际 问题 解决 中 ， 此 类 方法 还 存在 的 另 一 类 困难 是 来 源 于 实际 分 析 仪器 所 产生 数据 的 局 限 ， 对 
于 二 维 荧光 光谱 仪 所 产生 的 一 维 双 线性 谱 一 般 不 存在 问题 ， 但 是 ， 对 于 另 一 类 可 产生 二 维 双 
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线性 数据 的 色谱 波谱 联 用 的 分 析 仪器 ， 则 因 色 谱 的 条 件 的 难于 控制 ， 而 使 色谱 在 保留 时 间 的 
方面 难于 保证 准确 无 误 的 重 现 性 ， 所 以 也 给 上 述 讨论 的 方法 带 来 困难 。 如 何 根据 实际 情况 米 
对 联 用 仪器 所 产生 的 二 维 数 据 进 行 适当 的 预 处 理 ， 使 之 合 平 灰色 分 析 体 系 矩 阵 校正 方法 的 基 
本 要 求 和 假设 ， 仍 是 化 学 计量 学 家 们 需要 继续 研究 的 一 个 重要 课题 。 


第 四 节 露 色 分 析 体系 的 多 元 分 辨 方法 


对 于 分 析 试 样 毫 无 验 前 信息 , 即 有 关 其 物种 数 , 哪 几 种 化 学 物种 及 其 浓度 范围 此 不 清楚 ， 
分 析 化 学 的 任务 是 首先 确定 其 物种 数 ， 进 而 解析 出 各 纯 物 种 的 谱 图 (可 以 是 光谱 、 波 谱 ， 
P, 即将 其 首先 转化 成 为 白色 分 析 体 系 , 然后 进行 定量 分 析 。 这 类 分 析 体 系 是 分 析 化 学 中 最 
难 的 一 类 体系 ， 像 个 黑 茵 子 ， 故 我 们 称 之 为 “黑色 分 析 体 系 ”。 在 以 后 的 讨论 中 ,我 们 将 
看 到 分 析 化 学 计 基 学 家 们 已 研究 出 了 不 少 基于 年 阵 数据 结构 和 张 量 数据 结构 的 化 学 计量 学 解 
析 方 法 , 尤其 是 对 于 色谱 联 用 仪器 ,如 液 相 色 庶 与 二 极 管 阵列 联 用 仪 CHPLC-DAD), 气相 色 
谱 与 质谱 联 用 仪 “GC-MS)、 气 相 色 谱 与 红外 光谱 联 用 仪 CGC-IR) 等 所 产生 的 矩阵 数据 , 已 
发 展 了 一 系列 解析 新 方法 ， 可 和 望 解决 黑色 分 析 体 系 的 快速 定性 定量 分 析 问 题 。 

黑色 分 析 体 系 的 分 辨 算法 在 本 章 将 以 矩阵 分 辨 算法 和 张 量 分 辨 算法 为 线索 展开 。 从 理论 
上 说， 基于 算 阵 分 辨 的 方法 很 难得 到 有 物理 意义 的 唯一 解 。 但 是 ， 如 果 存 在 一 些 具有 特殊 条 
和 件 的 数据 ， 其 中 特别 是 色谱 联 用 仪器 所 产生 的 二 维 数据 ， 情 况 就 发 生 了 变化 。 这 些 仪器 包括 
液 相 色谱 与 二 极 管 阵列 联 用 仪 “HPLC-DAD)， 气相 色谱 与 质谱 联 用 仪 (GC-MS)、 气 相 色 谱 
与 红外 光谱 联 用 仪 GC-IR) 等 。 因 这 些 数据 不 但 同时 包含 了 光谱 和 色谱 的 信息 ， 而 且 ， 色谱 
还 具备 很 强 的 分 离 特 性 ， 可 使 一 个 很 复杂 的 混合 体系 分 解 成 为 相对 简单 的 子 系统 ， 并 且 这 些 
于 系统 还 同时 具有 一 些 别 的 有 用 特征 , 这 就 为 分 析 化 学 计量 学 家 们 提供 了 机 会 。 近 几 年 来 , Ж 
于 自 模式 曲线 分 辨 法 ,分析 化 学 计量 学 家 们 提出 了 很 多 的 新 算法 , RES 1795 1171 均 
可 给 出 令 人 满意 的 结果 , 如 渐进 因子 分 析 法 、 和 窗口 因子 分 析 法 、 直 观 推导 式 演进 特征 投影 法 、 
正 交 投影 分 辩 法 、 子 窗口 因子 分 析 法 等 。 对 于 这 些 方法 及 其 发 展 历史 ， 本 书 将 给 出 较 详细 的 
介绍 和 讨论 ， 为 本 书 的 一 个 重点 。 对 于 张 量 分 辨 方法 本 书 也 将 作出 必要 的 介绍 。 


一 、 基 于 主 成 分 分 析 的 体系 组 分 数 确定 方法 


异 主 成 分 分 析 确 定 体系 独立 组 分 数 的 有 关 理论 和 方法 , 是 黑色 分 析 体系 解析 的 至 关 重 要 
的 第 一 步 。 多 年 来 有 关 此 方面 已 有 较 多 研究 32 ~，Malinowski 对 此 进行 了 全 面 系统 的 研究 ， 
提出 了 因 于 分 析 ( 主 成 分 分 析 ) 的 误差 理论 :9 , 并 给 出 了 几 种 确定 化 学 混合 体系 物种 数 的 判 
别 标 准 。 
所 谓 主 成 分 分 析 (PCA), 又 称 因子 分 析 (FA)， 这 两 种 方法 在 数学 上 就 是 对 数据 量 测 乱 
阵 的 协 方差 阵 进行 正 交 变换 ， 找 到 量 测 矩阵 的 协 方差 阵 的 特征 值 和 特征 向 量 (参见 第 十 一 
章 )， 继 而 确定 体系 的 主 成 分 成 主因 子 ， 即 化 学 混合 体系 的 纯 物 种 数 。 

BX AiG VC BOE. Жр z., 为 第 :个 混合 物 在 第 j 个 波长 或 更 一 般 地 称 为 
敏感 通道 D 的 量 测 值 , 在 此 对 混合 物 样本 有 一 限制 , 即 每 个 混合 物 中 各 组 分 的 相对 浓度 应 不 
尽 相 同 或 对 应 成 比例 ， 用 秆 阵 可 具体 表示 为 


x= ° - (6-208) 


261 


RP, m 为 混合 物 波谱 数目 , = 为 波长 (分 析 通 道 ) ЖН. MER m 和 都 大 二 体系 实际 存 
在 的 独立 组 分 数 〈 即 体系 的 纯 物 种 数 ) 。 

显然 ， 如 不 存在 量 测 误差 , 则 下 矩阵 的 秩 就 代表 体系 中 存在 的 独立 组 分 数 ， 这 是 因为 矩 
阵 的 秩 就 代表 此 甜 阵 中 线性 无 关 的 向 量 的 个 数 。 确 定 甜 阵 牧 的 方法 有 几 种 ， 本 文 主要 介绍 主 
成 分 分 析 的 方法 。 

FOR BME X 的 协 方差 阵 Z, 

Z=X'X (6-207) 

协 方差 阵 Z 为 对 称 正 定 阵 ， 这 样 就 可 采用 正 交 变换 的 方法 来 求 出 它 的 特征 值 和 特征 向 

量 ， 不 为 零 的 特征 值 的 个 数 就 是 答 阵 的 秩 。 如 设 X' 为 不 含 仔 何 误差 的 数据 矩阵 ， 则 有 


жоо с 0 0 ° 
0 Xo 0 0 o 0 
Q'X"X'«Q—- 0 0 — X ос O (6-208) 
0 0 9 0 0 = 05 
оон 0 0 « 0 


RF, d 为 独立 组 分 数 , FAD AS QU Oy XC BOSE ORE BERE, 然而 , 实际 上 任 
何 量 测 都 存在 误差 ， 即 


X=X'`+E (6.209) 
式 中 ，E 为 误差 矩阵 。 如 果 直 接 对 量 测 矩 阵子 的 协 方差 阵 Z 进行 正 交 分 解 ， 一 般 可 得 
À 0 9 0 0 0 
0 À = 0 0 wm O 
QXXQ—-|0 0  & 0 = 0 (6-210) 
0 0 0 o] 
оон 0 0 е А 


原先 那些 为 零 的 特征 值 因 误差 的 影响 都 转变 成 非 堆 ,仍然 有 ADA. 这样， 探讨 体系 中 的 独 
立 组 分 数 (主因 子 数 ) 的 问题 , 就 转换 成 在 误差 的 影响 之 下 ，(6-208) 式 右边 对 角 阵 中 原 为 堆 
的 特征 值 将 会 怎样 转化 为 非 零 ， 以 及 如 何 来 确定 存在 误差 的 矩阵 X 的 独立 给 分 数 的 问题 。 
(一 ) 误差 扰动 下 的 协 方差 阵 特征 值 变化 限制 
由 式 (6-207), BURG 
Z=X'X=(X'+E)'(X" +E) 
=X''X"*+X''E+EX'+EE 
=2' +22 
Z' 在 62 扰动 的 影响 下 ,其 特征 值 如 会 发 生 什么 样 的 变化 ,变化 的 幅度 受 什么 限制 ? 在 
此 ,可 采用 形式 求 变 分 的 方法 ,并 略 去 二 阶 以 上 的 小 量 , 即 可 求 出 特征 值 入 (i 二 1,2,…,qd) 的 
变化 情况 .根据 特征 值 与 特征 向 量 的 性 质 ,(6-208) 式 可 写成 如 下 形式 
Z'q; =; q; 《6-211) 
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式 中 , 9/ 为 矩阵 ОРЕ 7 个 列 向 量 , А; ЗНАНИЕ ЖИРЕН. 4 joa 时 . BE 
对 式 (6-211) 微分 得 


3(Z')q; +Z òg; =А Gs +604 Эд; (6 212) 
两 边 对 和 应 特征 向 量 g; TENER, 
gZ Og; 907 (q; =] qr 6g: ESTICUDY FAC (6-213) 
由 于 2 为 -对 称 阵 , 即 有 
aZ S= Ag Ag (6-214) 


这 样 ,就 可 将 式 (6 213) 左 边 的 第 二 项 和 右边 的 第 一 项 略 去 ,所 以 有 
479709; =8A 04 д. 


即 得 
$Q; =g aZ 4: ar g) (6-215) 
HAG 2150 HUBER 
180;Э.= 114; Wea Mg; Clas 1) (6-216) 
RH. | - 上 表示 任意 一 种 矩阵 范 数 。 
AQ’ AEM. MAE a; 1—1-38B |4; | 一 1, 于 是 , 式 (5-216) 可 简化 为 
BADIS |] 827» | (6-217) 


从 式 (6-217? 可 以 看 出 ,所 有 实 对称 和 矩阵 的 特征 值 问题 是 良 态 的 , 它 仅 与 8(Z* ) 的 范 数 有 
R. 而 主 成 分 分 析 中 所 遇 到 的 数据 协 方差 阵 Z 均 系 实 对 称 年 阵 ， 这 就 为 借 主 成 分 分 析 来 确定 
体系 独立 组 分 数据 供 了 理论 依据 。 

MAR (6-217) "ШЖ, [90/0 DF FOZ") || OE RIBUS KG WIAD ;要 小 于 
SP ERM RAPHE, DH RRR (XX"'E 十 EX' CERE) HOO ERE. 再 求 出 
它 的 特征 值 ， 即 可 得 出 1867 ) | 的 上 限 ， 据 此 即 可 判断 体系 中 至 少 含有 多少 个 独立 组 分 数 。 

<) 因子 分 析 的 误差 理论 

由 于 实验 误差 ， 任 何 数据 量 测 年 阵 此 可 表示 为 两 部 分 ， 即 


+= r te, (6-218) 
ЖЕЕ, A (6-218) 也 就 是 式 〈6-209) 的 标 景 式 。 另 外 ,根据 OXXO, +5 U=XQ, WA 
x=ug' 
在 此 利用 了 & Xe P ESE HE. me 
z= 5 Hai (6 219) 
MRE OX OK, X $x'-—uvg' m 
x; = > Ha Gay (6-220) 


m 
Җ (6-219), (6-220) 说 明 , X Ah л PATER 0, G=1, 2, us, n) 线性 表 出 ， 而 
X" Ma di a 个 相互 正 交 的 向 量 g; G=1, 2, 5 d) 线性 表示 , ARE E GS (e ERI OR 
XZ. MUA 


i 
M K 
è 
t4 


[o (6-221) 
= “Та 


BIRER E (LUI PRES БЕЙИ: X SCR PE EE @ 来 线性 表 出 ,在 此 ,将 其 分 成 两 部 
分 ,第 一 部 分 了 ox au аЙ 个 大 特征 值 所 对 应 的 特征 向 量 фу 1:2, 7d), Malinowski 
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将 这 4 AAE IS EE $K EM: BROS Colin, FA Н RGR IE EST Hi AB SEAT TE TEST 
В q,Ci— dcl dor 2,7 00, — BEBUK E W ET YI A 25 GE (AB TR Л. Malinowski 将 它们 称 为 
次 轴 。 

将 (6-218) 式 用 (6-220) 式 和 (6-221) 式 来 表示 ,可 得 


z, = 5 Caiga toig) t X (8-222) 
对 照 (6-219) 式 , 令 "T "m 
z = Š Сав) Ti x ite, (6 223) 
如 写成 矩阵 的 形式 , 则 和 有 ~ ~ 
X=U'Q'+ Аў (6-224) 


06-224) P BJ) Q BYR X—UQ' 中 的 特征 向 量 阵 ,而 
| 


v=] ae (6 225) 
P иш 0 ol 
го 0 dhan su 
o 0 = А 
A= "шз 7 (6-226) 
LO c 0 aa с Oa 
式 (6-224) 古 边 分 成 了 两 部 分 , 即 
X=X +X 
其 中 
xv (6-227a) 
x= Ag (6-227b) 


EX HER REAP) RN Ee TR X 的 主要 信息 ,而 XT 则 为 
次 轴 所 构成 的 矩阵 , 它 主 要 反映 了 量 测 误差 的 信息 。 
根据 正 交 变换 不 改变 矩阵 的 迹 的 原理 (参见 第 十 一 章 ) ,依照 式 
Q'X'XQ=diag (A), 


ШО) = >) >) z=u(Q'X'X0)=ir(U'U) 


À O e 0 0 c 0 


0 А 0 0 0 

一 trace10 0 A 0 O;= DA 
0 0 0 X 0 
1с 0 0 0 c Àj 


这 些 特征 值 亦 可 分 成 两 组 ,一 组 由 主因 子 阵 给 出 ,而 另 一 组 则 由 误差 引出 , 即 
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пон = У) u'-aqxcro 


= = 
=tr(g'9U USTU U) 
= ч e B 
= DM 
= £t 
ГА 9 0 0 0 
jo А 0 0 о 
i d 
一 trace|0 0 моо о [= MA 
0 0 о 0 0 = 
0 0 о 0 ol 
而 
и(Х“Х°)= у) уу dieque 
ая 
=tr(Q'QA'AQ'O) =tr(A'A) 
з e] 22 
- E 
го 9 0 0 2^ 
| 
о 0 0 0 ol 
=trace| 0 0 0 0  Of= УА (6-228) 
бое о Aa „| “® 
оон 0 0 = À 


FELIS PS GE FIS E SERE BE RU TE OER — H6 t: Д] С S o — SO ,而 且 
还 利用 了 式 (6-227) 表 出 的 关系 及 式 (6-225) 和 式 (6-226) 表 示 的 矩阵 的 正 交 特性 。 以 后 ,为 示 
以 区 别 , 特 在 前 也 个 特征 值 上 标 一 标记 “十 ”, 即 AC Gm 12D ,以 表示 它们 是 来 自主 因子 
阵 ;而 在 后 (x~Q) 个 特征 值 上 标 以 “0”, 即 记 为 入 (I 一 1,2,…,d), 来 表示 它们 湖 来 自 误差 。 这 
样 , 则 有 


> a= Vat > 
m “йд 
MR (XX) = ya BER uX = 2 A, YB 
> > Ciar = > R= š > СИ (6-229) 
= <=. = S 


式 (6-229) 说 明 , 只 要 主因 子 数 d AEWRE: WE DARRAR GE E G12 DS 
和 实际 上 是 完全 由 误差 的 平方 和 所 构成 。 
仿 此 我 们 可 定义 由 式 (6-221) 所 表示 的 纯 误差 在 整个 因子 空间 {9, Gi 1.2, 0) F 8945 
征 值 之 和 ， 
А d n 
Mas Vat > А" (6-230) 
= = 


“яз 
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在 此 ,以 上 标 e 来 表示 是 来 自 误 差 。 Жи 
>= > > (s (6-231) 


tl jel 


£ х=}, M (y: (6-232) 


[SEIN 


这 是 因为 在 进行 正 交 变 换 时 ， ТУРУТ 结合 式 (6-230) 到 式 (6-232)， 
又 因 SS (e- > д 


el =) 


TRA 
mod 


ix le) = > Cat e+ Уу У) (od? (6-233) 


式 (6-239) 左 边 为 量 测 误差 平方 和 , 它 它 同 样 可 表示 为 误差 在 ”个 全 因子 空间 的 投影 平方 
和 ,其 中 第 -- 项 代表 量 测 误差 在 主因 子 轴 上 的 投影 平方 和 , 它 在 因子 分 析 中 不 能 被 除去 ;而 第 
二 项 则 代表 量 测 误 差 在 次 因子 轴 寺 的 投影 平方 和 , 它 在 因子 分 析 过 程 中 可 以 被 剔除 .这 三 项 都 
与 所 谓 的 剩余 标准 偏差 有 关 , 即 


mn(RSDY= У) У) (e (6-234a) 

1 
md(RSDy— У > (a (6-234) 
m(n—d)(RSDY*= > У о У а (6-234c) 


mm prm 


R 06-234) 的 3 个 表达 式 告 诉 我 们 ， 可 以 从 不 同 的 途径 来 求 RSD。 将 式 〈6-234》 三 式 代 人 
式 《6-233)， 并 两 边 同 除 以 nm 得 ， 

CRSDY = (d/n (RSD):+[(n~ad)/n](RSD)’ (6-235) 
这 一 重要 的 恒等式 就 总 结 了 上 述 的 误差 理论 。 在 因子 分 析 中 ，RSPD 可 被 分 为 两 项 : BARE 
GE) 和 抽出 误差 (XE)。 换 言 之, 剩余 标准 误差 (RSD)， 即 真实 误差 CRE)， 可 由 一 勾 股 定 
理 的 方式 表 出 : 


(REY =UE) + (XEY 
式 中 
RE=RSD 
= vdm RSD) 
= /[G=—2)/s] (RSD) 

3& (6-234 TF y REE, BE RSD RES п] йз И ROHR E A, (= 
1,2,…,#) 联 系 起 来 。 这 说 明 只 需 算出 了 协 方 差 阵 的 特征 值 ,就 可 将 RE IE ХЕ 都 分 别 求 出 
来 ,为 确定 体系 的 独立 组 分 数 d BE ET ЭБЕН. 

(三 ) 主 因子 数 确定 方法 

由 于 存在 基 测 误差 ， 要 精确 确定 未 知 混 合体 系 中 的 独立 组 分 数 〔 主 因子 数 ) 的 确 是 一 相 
当 困 难 的 任务 。 为 解决 这 一 问题 , 已 提出 很 多 种 方法 ,它们 可 分 为 两 大 类 ， CD 基于 量 测 误 差 
大 小 已 知 的 方法 ;加 对 量 测 误差 大 小 无 可 估计 ,只 根据 计算 所 得 结果 来 作出 近似 判断 的 方法 。 
下 而 分 别 对 它们 作出 介绍 。 

1. 基于 量 测 误差 大 小 已 知 的 方法 
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这 些 方法 的 基点 是 假设 量 测 误差 已 知 ， 然 后 与 算出 的 量 测 数据 矩阵 X EME. 并 根据 
某 一 原则 取 某 个 主因 子 数 所 求 出 的 误差 大 小 进行 比较 ,如 该 算 出 的 真实 误差 (RE) WATE 
知 量 测 误差 的 范围 ， 则 据 此 可 确定 主因 子 即 体系 的 独立 组 分 数 。 昌 前 基于 明 测 误差 大 小 已 知 
的 方法 中 应 用 较 多 的 是 
剩余 标准 偏差 法 〈 真 实 误差 法 ，AF 法 )- 
该 法 由 Malinowski 提出 ， 其 计算 式 由 式 (6-236) 给 出 ， 即 
m(n—d)(RSD):= » > G'— М д (6-236) 


式 中 ， RSD 与 真实 误差 (RE) 是 同一 的 ， MAR (6-2346) Плн. 它们 的 大 小 就 代表 了 co 均 
方差 的 大 小 ， 将 式 (6-236) 重新 排列 可 得 
RE2=RSD:= > [ma 一 ea] (6-237) 


E 
上 式 提供 了 一 个 很 好 的 确定 主 内 子 数 的 标准 ， 其 判别 过 程 如 下 : 

首先 先 把 最 大 特征 值 所 对 应 的 特征 向 量 看 成 主因 子 轴 《〈 主 轴 )， 其 余 的 都 看 成 次 要 因子 
QRAD 而 包括 在 上 式 中 来 计算 RSD, 并 将 此 计算 值 与 已 知 的 量 测 误差 进行 比较 。 如果 RSD 大 
于 已 知 的 量 测 误差 , 那么 则 说 明 主 因子 数目 就 等 子 1, 该 因子 空间 是 一 维 的 。 仿 此 可 继续 考虑 
第 二 大 的 特征 值 , 如 此 时 RSD 仍然 大 于 已 知 量 测 误差 , 则 需 继续 考虑 第 三 个 特征 值 所 对 应 的 
特征 向 量 , 如 此 下 去 直至 当 取 到 某 个 特征 值 所 对 应 的 特征 向 基 , 它 所 对 应 的 RSD 已 与 所 知 基 
测 误差 近似 相等 ,这 时 所 已 包含 的 主轴 中 的 特征 向 量 的 个 数 即 为 体系 中 所 含 独立 组 分 的 个 数 。 

2. 量 测 误差 大 小 未 知 的 方法 

这 些 方法 毋 需 已 知 量 测 误差 ,但 因 一 般 可 设 量 测 误差 为 零 均等 方差 且 服 从 正 态 分 布 的 不 
相关 白 噪声 ， 故 可 据 此 设计 一 些 经 验 函 数 来 估计 主因 子 数 。Malinowski 设计 的 因子 指示 函数 
IND 法 0 和 Fisher 方差 比 u**: 就 是 这 样 的 例子 ， 可 用 于 在 量 测 误差 未 知 时 确定 主因 子 即 体系 
中 的 独立 组 分 数 。 

COO AFERRA ONDA) 因 量 测 误差 未 知 ， 不 可 能 像 上 述 方法 那样 采用 比 大 小 
方法 来 确定 主因 子 轴 , 所 以 IND 法 是 利用 某 一 原则 来 构造 一 个 因子 数 的 函数 ， 随 着 主因 子 数 
的 变化 这 个 函数 将 在 某 一 点 上 达到 极 小 ， 此 时 ， 该 极 小 点 所 对 应 的 就 是 主因 子 数 。 为 此 他 定 
XT tü FH IND 函数 : 


IND= RSD/i—4)* (6-238) 
利用 这 一 IND HRB. WM n PRIA, GH1, 2, =, n) 中 ， 逐 一 计算 不 同 的 二 所 对 
应 的 IND 值 , 即将 式 (6-237) 定义 的 RSD 代入 式 (6-238)。 当 上 为 真实 的 主因 子 数 时 , IND E 
数 将 出 现 最 小 值 ,此 最 小 值 所 对 应 的 即 为 我 们 要 求 的 主因 子 数 ( 混 合体 系 的 独立 组 分 数 ). 值 
得 指出 的 是 ， 对 于 一 般 纯 组 分 光谱 重合 不 严重 的 体系 ， 且 量 测 误差 确 为 零 均等 方差 且 不 相关 
白 噪声 时 ， 此 法 确 可 得 到 正确 的 主因 子 数 ,但 是 当 体系 纯 组 分 光谱 重 基 严重 时 ， 或 量 测 误差 
为 不 等 方差 的 噪声 时 , 此 法 难 子 得 到 正确 答案 , 表 6-13 示 出 了 一 个 用 IND 函数 来 判别 主因 子 
数 的 实例 。 

(2) Fisher 方 差 比 法 ”由 前 述 因 于 分 析 的 误差 理论 可 知 ， 特 征 值 Gls 2 nio 就 
代表 量 测 矩阵 的 方差 ， 所 以 ， 它 们 的 比值 就 可 相当 子 Fisher 方差 比 ， 另 一 方面 ， 从 统计 意义 
上 讲 ， 主 轴 (primary axes) 和 次 轴 (secondary axes) 所 对 应 的 特征 值 代表 了 不 同 的 意义 ， 即 
分 别 代表 了 组 分 光谱 信息 和 量 测 误差 的 信息 , 故 这 两 种 特征 值 应 存在 显著 性 差异 , Fisher 方差 
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比 法 的 基本 原理 就 在 于 此 .然而 ,Fisher 7r 2E Wit SABE OR Be Hl MK AE ЖЕН Ҥй E HR) n S 
布 ， 因 所 有 的 因子 轴 《〈 即 特征 向 景 ) 是 相互 正 交 的 ， 故 独立 性 这 一 条 件 完全 满足 ， 而 数据 的 
残 差 一 般 都 服从 正 态 分 布 ， 所 以 、 特 征 侦 比 检验 对 上 述 的 两 个 统计 条 件 是 基本 上 满足 的 . R 
据 式 〈6-228)， 可 将 误差 特征 值 〈 次 轴 ) HAN EREN 


Var(0) D>] Aiak) (6-239) 


22 
se 


表 6-13 体系 中 组 分 数 的 IND 法 确定 


А, | RSD хрх | ; | n RSD INDx 10 
mm ^ 19.193398 | 0.015461 ~ 24.16 ç | бо | 0. 000787 B. O 
2 9. 368079 0. 003208 "EP 9.000760 19.0 
3 0.009065 00000 j o ss в 0.000182 | 0.000704 70.4 
4 0. 004414 0.000960 3.85 9 6. 000099 | 
5 0. 000294 0.000889 — | 5.56 | l | 


对 应 千 主 轴 的 特征 值 主要 来 自 组 分 量 测 谱 的 贡献 ， 因 显著 地 大 于 误差 特征 值 〈《 次 轴 ) 对 
应 的 方差 ， 可 记 为 Var(%)。 而 特征 值 ~- 般 都 是 按 大 小 顺序 排列 ， 因 此 可 以 这 样 来 构造 Fisher 
检验 : 


Fsn—k)= Var(k)/Var(0) mA -/ S A 6-240) 


式 中 . 1 和 ak) PHBA Fisher 方差 比 检验 的 自由 度 ， 这 是 因为 每 一 个 特征 值 对 应 于 一 个 
自由 度 。 HA n OE, 对 应 不 同 的 & 值 : 都 进行 一 次 Fisher 方差 比 检验 , 直至 所 取 的 得 到 
了 具有 显著 性 差异 结果 为 止 。 

值得 指出 的 是 ， 以 上 的 主因 子 数 的 确定 方法 都 是 从 用 整个 矩阵 的 特征 值 〈 它 们 反映 了 整 
个 协 方差 阵 的 方差 来 考虑 的 ， 对 于 这 样 的 方法 ， 常 被 称 为 全 局 因子 分 析 法 。 在 以 后 的 讨论 
中 可 以 看 到 ， 对 于 一 些 组 分 量 测 光 谱 重要 不 严重 且 组 分 相对 浓度 相差 不 大 的 混合 物体 系 ， 这 
类 方法 一 般 可 以 得 到 真实 解 。 但 是 ， 对 于 一 些 组 分 量 测 光谱 重 杰 严 重 且 组 分 相对 浓度 相差 很 
大 的 混合 物体 系 ， 此 类 方法 就 一 般 不 可 靠 了 ， 此 时 宜 用 局 部 因子 分 析 法 来 估计 体系 的 独立 主 
因子 数 。 有 关 这 一 结论 的 论述 ， 将 在 以 后 的 讨论 中 逐步 展开 。 

努 外 ， 因 为 特征 向 量 ， 其 中 特别 是 载荷 失 量 就 反映 了 组 分 景 测 谱 的 综合 信息 ， 所 以 ， 主 
因子 数 的 确定 方法 也 可 以 从 特征 向 量 的 角度 来 考虑 ， 此 法 的 要 点 就 是 直接 观察 特征 矢量 ， 那 
些 只 包含 误差 信息 的 特征 向 基 应 该 就 对 应 子 次 轴 。 有 关 这 一 点 的 论述 ， 也 将 在 以 后 的 讨论 中 
逐步 展开 ,并 给 出 实例 加 以 说 明 。 


=. SRR RAK 


在 确定 了 体系 的 独立 组 分 数 以 后 ， 对 黑色 分 析 体 系 的 解析 的 下 一 步 就 是 分 辨 出 纯 物 种 的 
光谱 了 ,有 最早 提出 的 光谱 分 辨 基本 思想 是 自 模式 曲线 分 辨 法 (SMCR)H 拉 。 根据 Lambert-Beer 
定律 ， 本 节 所 讨论 的 混合 物 量 沽 谱 和 矩阵 发， 实际 上 可 表 为 两 个 矩阵 的 乘积 ， 即 

X=CS+E (6-241) 
其 中 ，C 称 为 浓度 分 布 答 阵 ， 它 是 由 每 个 不 同 纯 组 分 的 浓度 矢量 构成 ， 为 一 (та) 阶 的 矩 
Fr. 而 5 则 为 纯 组 分 的 量 测 光谱 所 组 成 ， 为 一 in Xd) 阶 知 阵 。 对 娩 色 分 析 体 系 进行 分 辩 的 
ER BRE PR GR EA A RER., ARARA ЎВА EE 
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就 是 先 求 出 纯 物 种 的 光谱 , 亦 即 纯 组 分 的 量 测 光谱 矩阵 S, 也 就 是 先 将 黑色 分 析 体系 “白化 ”， 
继 利用 最 小 -乘法 即 可 求 得 浓度 分 布 和 矩阵 C， 以 完成 对 黑色 分 析 体 系 的 同时 定性 定量 解析 ， 

因 在 本 书 将 要 讨论 的 黑色 分 析 体系 的 分 辨 方法 大 都 源 册 于 自 模式 曲线 分 辨 法 ， 所 以 首先 
将 对 此 法 进行 详细 的 介绍 ， 另 外 ， 基 于 自 模式 曲线 分 类 法 而 发 展 的 很 多 方法 也 主要 是 基于 算 
阵 类 型 的 数据 ， 即 〈6-241) R, 所 以 , 将 它们 都 统称 为 矩阵 分 辨 方法 。 以 使 与 基于 张 量 数据 
的 分 辨 方 法 进行 区 别 。 

(一 ) BRK BRR 

自 模式 曲线 分 辩 法 主要 基于 主 成 分 分 析 《PCA》, 其 基本 假设 只 有 两 条 : 中 混合 物 量 测 谱 
符合 线性 加 合 性 ; © 波谱 景 测 值 只 能 为 正 值 。 因 这 两 条 假设 要 求 条 件 对 -- 般 波谱 仪器 所 产生 
的 数据 皆 可 成 立 ， 故 其 适用 性 较 广 ， 该 法 最 早 由 Lawton 和 和 Sylvestre 提出 中 ,他 们 以 两 组 分 
混合 物体 系 的 纯 物 种 光谱 解析 为 其 目标 ， 以 得 到 它们 的 可 行 解 . 后 被 拓 广 至 三 组 分 或 三 组 分 
以 上 的 混合 体系 。 因 随 着 组 分 数目 的 增加 ， 纯 组 分 光 潜 的 可 行 解 域 确定 的 困难 显著 增加 ， 为 
叙述 方便 ， 本 书 将 其 分 成 两 步 加 以 介绍 。 

1. 两 组 分 体系 的 纯 组 分 波谱 辨析 

【基本 思路 】 

对 于 任 -两 组 分 混合 物 波谱 ， 根 据 Lambert Beer 定律 可 表示 为 

Xi = casi tess G=l1,2,: m) (6-242) 

RT 86 一 上 2) 为 未 知 组 分 的 纯 物 种 波谱 矢量 , 由 在 某 特定 波长 区 域 所 济 得 的 波谱 非 负 量 测 


HAR EWE > ы=1› 在 此 , n 为 波谱 量 测 点 数 ; c, 和 c* 分 别 表示 两 纯 物 种 的 相对 浓度 ， 


АД са css ER HLA. 此 条 件 说 明 各 混合 物 中 的 相对 浓度 应 不 尽 对 应 成 比例 ; 
为 混合 样本 个 数 。 一 般 要 求 m 和 都 要 人 于 体系 的 纯 组 分 数 《 此 例 为 2) 。 

总 的 说 来 ， 自 和 模式 曲线 分 辨 法 的 第 一 步 是 对 数据 矩阵 于 进行 主 成 分 分 析 ， 然 后 ， 通 过 前 
述 的 两 个 约束 条 件 来 求 出 中 (一 1,2) 的 可 行 解 域 。 

【基本 算法 

两 组 分 体系 自 模式 曲线 分 辨 法 的 具体 计算 步骤 如 下 ， 

O 计算 混合 样本 组 成 的 量 测 矩阵 的 协 方差 阵 ， 继 对 其 进行 正 交 变 换 ， 分 别 求 出 其 特征 
值 和 特征 向 量 ， 


À 0 0 
о А о 0 

QXXQ-|0 оз 0 0 | (6-243) 
о 0 0 À 0 
0 0 - 0 0 = 引 


式 中 , Q 为 列 向 量 相互 正 交 的 特征 向 量 矩 阵 ,，% 为 相应 的 特征 值 ， 并 设 ADA u 人 一 1，2，…， 
n—1), 

从 上 一 节 讨 论 的 结果 可 知 , 对 于 二 组 分 混合 体系 ,我 们 知道 矩阵 X 的 秩 为 2， 即 除 4 和 
АЉ. ДЕВЕТА, BA. А 所 对 应 的 两 个 特征 向 量 qi. 2; 组 成 新 的 特征 向 量 
EEQ, В 
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Q' 一 [9 d (6-244) 

EREE 是 一 个 (nx2) 阶 的 甜 阵 ， 它 的 每 一 列 都 含有 个 元 素 ， 即 相当 于 波长 的 量 

测 点 数目 ， 在 因子 分 析 中 常 被 称 为 载荷 矢量 〈loadings)， 在 多 元 分 辨 中 也 常 称 为 拍 象 量 测 谱 。 

从 线性 代数 的 知识 可 知 (参见 第 十 一 章 ), Hs. s 所 张 成 的 线性 空间 ws) S3 H g; q; 所 
张 成 的 线性 空间 yg) 相 等, 基 YO —w GO ,它们 可 以 相互 线性 表 出 ， 

$= Fig: (j=1,2) (6-245) 


TRA (6-202) 式 可 知 


=c (engi tig Hen aq taqa) 

= (catu Heater gi + Cutie Tete G2 

Sungi us: G=1.2. m) 
Aa. 9. Ех PHAM, Han gq: 相互 正 交 ， 故 可 容易 求 出 ins uK, 

9191 =ung Git did 


=и14191 
NA 
us = xXiq/giqi—xiq (6-246) 
同 理 可 得 
ue= Xiq2/430:— xq; 《6-247) 


在 此 利用 了 正 交 矩阵 的 性 质 :gig:=0 和 989,=1G 一 1,2)。 
《2) 约 东 条 件 的 计算 
CD 波谱 量 测 值 只 能 为 正 值 之 约束 条 件 的 计算 
从 式 (6-245) 可知 


$,7—iaQuRiggaz0 — (j—1. 2; i=1, 2, 5 n) (6-248) 

亦 即 
102—0 [,/ Фа H 9220 (6-249a) 
teSmax|qu/qalta™4 q <0 (6-249b) 


上 述 不 等 式 (6-240) 之 所 以 成 立 , 是 因为 用 主 成 分 分 析 方 法 所 得 的 第 一 特征 矢量 g 的 每 一 元 
Xa G=1, 2, = n) 蕴 大 于 或 等 于 零 。 
© 组 分 浓度 值 只 能 为 正 值 之 约 东 条 件 的 计算 : 
TAK (6-245) НЕ, ШН 
51=4191 Hg (6-250a) 
S= inq T 6o; (6-250b) 
MRASAMRRBA, XX (6-250) TRA 
s i 4p 
МЕНИ «а 
A, RE хес сар G=1, 2,00, m), 8 
si qi 
xe ME 66-252) 


将 式 (6-251) 代 人 式 (6-252) 可 得 


270 


t t 4 g 
xe all dent | (6-253) 
ta tadig: -4:4 
所 以 有 
t t 4 
[eae] Desi (6-254) 
ta (ш 
E 
Pu tay М _ ~) 
fay ind Сы ty 
wo ta] Te- 1 [* cel 
La ta in Lus fife бабы, tn typ 
对 于 tata tuns J 80 A 
it ta [ea 
[= | <o 
B5 fn ugd 
写成 标量 形式 则 有 
him шах /un fu (6-255a) 
een 
fa S min [uo /ua [tar (6-255b) 
Eon 


(3) 可 行 解 域 的 图 像 表示 “从 上 述 讨 论 可 以 看 出 ， 纯 物种 波谱 8 (一 1.2) 及 混合 物 波谱 
RE xG =1,2, n) EP] EAT HE gog: 组 成 的 二 维 空间 坐标 表 出 ,而 不 等 式 (6-251) 及 式 
《6-255) 又 可 由 qq; 组 成 的 二 维 空间 平面 中 的 直线 表 出 。 借 计算 机 图 像 显 示 功 能 , 即 可 在 二 
维 平面 上 将 纯 物种 波谱 sCj 二 1,2) 的 可 行 解 域 表示 出 来 ,只 要 确定 了 sj 一 1,2) 在 此 二 维 平面 
上 的 坐标 Ga. 452?， 即 可 根据 式 〈6-245》 求 出 的 可 能 波谱 形态 。 下 以 Lawton 给 出 的 一 个 


实例 对 上 述 计算 过 程 加 以 具体 说 明 。 


0 > Lu DR 
410 455 150 530 570 610 650 690 730 
该 长 /nm 


图 6-21 5 个 两 组 分 混合 物 的 可 见 吸 收 光 凡 图 


得 两 个 组 分 的 可 行 解 域 的 外 约 东 界 К; 和 РС, 


由 图 6-21 所 示 的 5 条 可 见 吸收 光谱 曲线 是 
对 两 种 染料 的 混合 样本 量 测 所 得 ， 它 们 的 具体 
吸收 光谱 矢量 是 由 从 410nm ~ 700nm 每 隔 
10nm 读 取 量 测 数据 面 得 , I EA ИЕ 
BE X, 继 对 它 的 协 方差 阵 进行 正 交 分 解 , E Mi 4° 
对 应 于 最 大 特征 值 的 特征 向 量 , 由 式 (6-246) 及 
式 (6-247) 可 分 别 算 得 混合 物 波谱 矢量 x е. 
gs 组 成 的 二 维 空间 上 的 坐标 ， 它 们 分 别 为 x 
(125. 7, — 33. 4), x} (201. 7, — 6. 6), x3 (186. 5. 
—13. 2), x, (169. 3, — 13. 2) x} (235. 4,39. 5). 
按 此 计算 的 结果 可 得 由 gog: 组 成 的 二 维 平面 
ARFA 6-22, 用 (6-250) 式 可 得 两 个 组 分 的 
可 行 解 域 的 外 约 东 界 F A Fz 用 (6-255) 式 可 


HY Hs, 一 1， 利 用 这 一 条 件 ， 由 式 (6-245) 可 得 


У =i DV atte orl Gals 2 
令 Laisa Zqu=b WH 
tnattyb=1 

这 说 明 , 正规 化 为 1 的 Gel, 
2) 必然 落 在 由 go g HR = Aes 
间 上 的 一 条 直线 上 ， 它 就 是 图 6-22 
中 的 A 和 41 所 表示 的 线段 。 因 A, 
Ж А, 分别 落 在 可 行 解 域 中 , 所以， s, 
(7=1, 2) 也 就 必然 落 在 4. 和 有 4, 表 
示 的 可 行 解 域 中 。 求 得 $s G=1, 2) 
ЖЕ gis q; 组 成 的 二 维 空 间 中 的 坐标 ， 
就 可 容易 地 算得 它们 的 可 行 解 域 来 。 
图 6-23 所 示 的 下 ,和 下 ,就 将 它们 具 
体 表示 出 来 。 

【讨论 】 

这 一 方法 提出 后 ， 由 Kowalski 
等 将 其 用 于 气相 色谱 -质谱 0 及 高 
效 液 相 色谱- 紫外 可 见 光 谱 数 据 的 解 
eu mamam oman qu Л. 

图 影 部 分 | 和 1 分别 表示 两 个 组 分 的 可 行 解 域 ， 其 中 直线 А: 和 A 
RAR. 说明 用 此 法 可 分 辩 用 色谱 法 分 别 为 两 个 组 分 光 漠 n ft s TT FEO 
也 难以 很 好 分 离 的 两 组 分 体系 。 

Kawata 等 中 又 分 别 研究 了 实际 量 测 数据 所 会 误差 对 可 行 边界 确定 的 影响 以 及 在 可 行 解 
域 中 确定 最 可 能 纯 组 分 光谱 的 问题 ， 提 出 用 最 小 箭 的 方法 找到 纯 组 分 光谱 的 最 可 能 解 。 
Koenig"!" 等 对 在 分 辨 时 常 可 磁 到 的 一 种 特殊 情况 .. 即 某 一 组 分 在 一 段 波长 范围 内 有 其 自身 特 
殊 的 吸收 峰 的 两 组 分 分 辨 情况 ， 这 在 红外 光谱 指纹 区 很 是 多 见 ， 提 出 一 种 直接 确定 纯 组 分 唯 
一 解 的 方法 。 本 节 还 将 对 这 些 内 容 分 别 加 以 介绍 。 

CD 噪声 对 可 行 解 域 边 界 确定 的 影响 及 其 克服 方法 “在 前 文 的 讨论 中 ， 我 们 没有 考虑 噪 
声 的 影响 ， 而 在 实际 上 量 测 误差 的 存在 必 将 影响 到 抽象 和 量 测 谱 中 的 元 素 的 数值 ， 这 种 误差 即 
为 在 前 节 因子 分 析 误 差 理 论 中 曾 讨 论 过 的 置 人 误差。 从 式 (6-31) 可 以 看 出 ， 它 将 影响 到 可 行 
解 域 边 界 的 确定 ， 有 时 甚至 可 将 真实 解 排除 出 可 行 解 域 之 内 。 为 此 ，Kawata 将 滤波 的 方法 引 
人 ， 以 排除 qa G=1,2，…m) 中 小 于 喉 声 的 那些 数值 ， 即 对 qh 用 (6-250 式 进 行 重新 计算 : 

д = (@\-+ФЮ/да Go—1,2,, (6-256) 
式 中 ，o 为 一 常数 。 它 可 由 式 〈6-257》 给 出 


в„== | (1/п) > аа СЫ р.у (6-257) 


GB) А17 У) A/G-2)] (6-258) 


At, Gp) 的 定义 为 
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式 中 ,为 (& 一 1,2,.…… sn) 为 主 成 分 分 析 所 求 得 的 特征 值 , Н.Ж ASA, B] 6-24 RH T Se. 
之 间 的 关系 。 从 图 6-24 可 以 看 出 ， 如 果 UIT о, DU COE о, 而 代 之 以 qa， 这样 也 就 消除 了 
噪声 对 可 行 解 域 边界 确定 的 影响 。 


0 $, 1 
gn 


图 6-24 gti RRS 


Ат 
图 6-23 两 个 纯 组 分 光谱 я M s 的 可 行 解 域 
Раз АЙН, Fo: s MATHAR 
(2) MAREMA 在 前 述 讨论 中 知道 ，Lawton 和 Sylvestre 提出 的 自 模 式 曲 
线 分 辨 法 只 能 求 得 各 组 分 的 可 行 解 域 。 试 想 如 果 能 依照 某 一 原则 在 可 行 解 域 中 找到 一 个 合理 


的 唯一 解 ， 这 将 对 自 模式 曲线 分 辨 法 的 实际 运用 具有 重要 意义 。 为 此 ，Kawata 等 引入 了 最 小 
娘 的 概念 ， 即 用 组 分 光谱 自身 所 具有 的 特性 来 确定 最 可 能 的 纯 组 分 光谱 唯 - 解 。 他 们 在 实验 
中 发 现 ， 在 所 有 纯 光 谱 的 可 行 解 域 中 ,那些 不 是 实际 纯 组 分 光谱 的 可 行 光谱 实际 是 由 纯 组 分 
光谱 与 男 一 纯 组 分 光谱 的 线性 组 合 而 成 ， 从 而 导致 纯 组 分 的 导数 光谱 的 混合 程度 〔 即 粹 ) 增 
加 ， 故 提出 用 导数 光谱 的 焙 来 确定 唯一 解 。 其 具体 求解 过 程 如 下 : 


H,=— >; ра) =1,2) 
= 
AP pull у 个 被 放 纯 组 分 光谱 在 波长 点 i 处 的 二 阶 或 一 阶 导 数 , 并 经 式 (6-259) 正 规 化 ， 


b = 18,11 У) 18, | G=1,2,=" n) (6-259) 
= 


式 中 , у, Жк НИИ ТВ ; 个 被 故 纯 组 分 光谱 s, 在 波长 点 ; 处 的 二 阶 或 一 阶 导数 , 经 此 正规 
化 处 理 ， 刀 就 具有 概率 函数 的 性 质 了 。 
从 图 6-22 PÍ 81, s, s; 的 可 行 解 域 4; 和 4 可 由 式 〈6-260) Жл. BM 
s =s HOY) 0<Y,<1 (6-260a) 
s,=s; +(1—2)s; ` 0<7i<1 (6-260b) 

借 一 维 寻 优 的 黄金 分 割 法 ( 亦 称 0. 618 法 ) ,以 A= — X pile Co, 4 Н R g aT ЖН 
st 和 s, 的 唯一 解 来 。 

Kawata 等 用 上 述 方法 对 甲 基 栓 和 溴 甲 酚 绿 的 两 组 分 体系 进行 解析 ,同时 还 对 噪声 影响 可 
行 解 域 及 用 最 小 娘 求 唯一 解 也 作 了 探讨 ,所 得 结果 分 别 示 于 图 6-25 至 图 6-27. 从 图 6-26 可 以 
看 出 ,如 果 不 考虑 旧 声 的 影响 ,的 确 可 能 将 真正 纯 组 分 光谱 排除 在 可 行 解 域 之 外 ,图 中 注 甲 醋 
绿 纯 组 分 光谱 的 可 行 解 域 就 正 是 这 种 情况 。 在 图 6-27 中 ,在 考虑 了 噪声 的 影响 ,并 用 前 述 滤波 
方法 对 其 进行 滤波 后 ,确实 克服 了 噪声 的 影响 。 另 外 从 图 6-27 中 ,还 可 以 看 到 ,用 最 小 博 方 法 
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所 找到 的 纯 组 分 光谱 与 图 6-25 P BY ЗСС EB AO Wa W A BERE FS H bt C 
寻 优 的 方法 具有 一 定 实际 意义 。 


吸光 度 
吸光 度 


(a) (b) 
图 6-25 ”省 甲 酮 绿 和 和 甲 基 检 的 标准 光谱 图 
(a) Е (ВС), (b) AE HE (MOD 


HOCH 
吸光 度 
У, 


@ m m 


de 
R 
wal 


300 $20 306 620 
波长 /nm 波长 /nm 
ә) [CH 


图 6-26 УШИТЕ ЕНИ ЕАН ЕВИ 
(a RPR FIRR: (b) FREIA TRR 
'e) BRADER ERME ERKMAA CDD UL E A КИН АЕ 


吸光 度 


- - 一 


< 
> 


(a) (b) 


< 
> 


300 €20 300 620 
波长 /nm K/a 
(с) ба) 


图 6-27 进行 噪声 滤波 后 的 可 行 解 域 和 计算 所 得 各 组 分 光谱 图 
Са) 澳 甲 酚 绿 的 可 行 解 域 ，(b》 F ERE ASP TT PAR 
(e) 用 最 小 嵩 方法 算出 的 澳 中 图 绿 的 纯 组 分 光谱 ;d) ИИЛИП И НН ЖЕНИШ 
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2. 三 组 分 体系 的 纯 组 分 波谱 辨析 

最 早 用 自 模式 曲线 分 辨 法 来 进行 二 组 分 体系 的 纯 物 种 波谱 解析 的 要 首 推 M.Ohta*-. 他 
以 蓝 青色 、 洋 红 和 黄色 这 三 种 用 于 彩色 照相 中 的 染料 作为 分 辨 对 象 ， 用 白 模式 曲线 分 辨 法 找 
到 了 这 三 种 纯 组 分 光谱 的 可 行 解 域 ， 并 用 Monte-Carlo 方法 找到 了 一 组 可 能 组 分 光谱 . 
Ѕһага 在 此 基础 上 对 三 组 分 体系 的 纯 组 分 光谱 的 白 模式 分 辩 进行 了 进一步 的 研究 ， 并 对 其 
可 行 解 域 的 降 维 表示 技术 和 定量 分 析 进 行 了 关 述 。 

与 二 组 分 体系 的 纯 组 分 波谱 辨析 的 思路 类 似 ， 和 白 模 式 曲 线 分 辨 法 对 三 组 分 体系 解析 的 第 
一 步 仍 是 对 数据 撼 阵 区 进行 主 成 分 分 析 , 然后 , 通过 两 个 约束 条 件 来 求 出 s; G=1, 2, 3) 的 
可 行 解 域 。 

对 混合 样本 组 成 的 量 测 挫 阵 的 协 方差 阵 进行 正 交 变换 ,分 别 求 出 其 特征 值 和 特征 向 量 ，- 
NRA OR, BOAR X WR З. SUC. 4 ЖП А, 所 对 应 的 二 个 特征 向 量 9,、94; 和 
q: 组 成 新 的 特征 向 量 和 矩阵 0°, BI 


Q' —[ei a»: (6-261) 
在 因子 分 析 中 07 被 称 为 载荷 矢量 (loadings) HH, MRE WEE. 
与 前 节 内 容 相仿 ， 有 
$)=taqid-tagy t tags G-1,2,32 (6-262) 
和 
X= cas cos: + cas; (6-263) 
将 式 (6-262) RA (6-263) 式 ， 可 得 
xia 191118 Haqi) T co (а [taqa tud) Hes gi Hagi Hag) 
77 (cati Herta reatu) i + (cata berate: TP cata 5 Gti d eat do cata s 
angi agi drugs G=1,2,=' m) (6-264) 
与 前 节 对 二 组 分 体系 的 纯 组 分 波谱 自 模式 辨析 的 叙述 不 同 XX WE ERR ТЩ 
介绍 。 从 式 (6-264) 可 以 看 出 ， 
te = cat Heater Fenta (6-265a) 


omm Саба do Cabs do Cat se (6-265b) 
am Cutis T Gates + estes (6-265c) 
Tid uico [un oe a m Dt s firsts T om [ta ta t= [ta fas; 


则 上 述 方程 组 (6-265) 就 可 变 为 


et ос (6-266) 
HK (6-266) A (6-263) KR ,就 可 发 现 , 两 式 有 类 似 的 形式 。 不 同 的 是 , 式 46-263) 为 任 
一 混合 物 量 测 光 谱 由 n 维 纯 组 分 光谱 空间 {s,ss,s;} 的 线性 组 合 之 表 出 方式 ,而 式 (6-266) 则 为 
该 混合 物 波谱 在 维 正 交 因子 空间 {9 ,92ga} 之 坐标 组 成 的 向 量 om Dus] 在 一 三 维 空 
[Bl iti ,tayts} 的 线性 组 合 之 表 出 方式 。 然而 ,它们 的 线性 组 合 系数 是 同一 的 ,这 说 明 任 一 混合 物 
基 测 光谱 在 经 主 成 分 分 析 后 ,实际 是 可 由 一 三 维 线性 空间 来 表 出 的 ,而 且 这 一 关系 在 三 维 空间 
中 还 具有 相 网 形式。 以 下 还 将 证 明 , 当 满足 一 定 条 件 时 ,混合 物 光 谱 在 因子 空间 中 完全 落 在 一 
个 平面 上 ,这 样 ,三 组 分 混合 体系 的 可 行 解 域 就 可 在 一 平面 上 表 出 ,从 而 使 得 三 组 分 混合 体系 
的 可 行 解 域 的 确定 将 与 前 节 所 述 的 二 组 分 混合 体系 的 一 样 容易 。 
对 于 (6-34) 式 , 当 满 足下 述 条 件 时 ， 
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сао с 1 G= 1.2. ym) (6-267) 
则 混合 物 光谱 x G=1, 2, 01, m) 在 因子 空间 的 坐标 点 集 бм, ш, ua), G=], 2, ts 
六 )， 必 落 在 由 三 个 纯 组 分 光谱 在 因子 空间 的 坐标 点 [参见 式 06-337, Bl Gus ты, fis) + Gn 
tus ад, (fay taz ba) 所 构成 的 平面 上 。 
由 解析 几何 知识 可 知 , 三 点 决定 一 个 平面, 设 由 点 Gr bas ба), Gas tas ta) Gary tae 
no 构成 的 平面 方程 如 下 ， 


art BytYe=d (6-268) 
显然 有 
atu Rt Yt d (6-2692) 
atn + tar Yt d (6-269b) 
ata + Bta Yr = d (6-2690) 


所 谓 混合 物 光谱 1,2. ,m)E ERZIELEN 
БЕЛЕШ Ga tu sta) > Ga stn ha) (tnvtsszm) 所 构成 的 平面 之 上 ,实质 上 就 是 要 满足 ， 
aunt purt Yus = d (6-270) 
根据 (6-264) 式 ， 将 Gan шоу wa》 所 对 应 的 值 代入 式 (6-270 的 左边 ， 可 得 
acaty Fenta Fenta) H Plenti cot Hostia) HY lentis beater tistis) 
ea (at, + Bhe Yt) Hea Gat + Biat Yt) Hens lats + Btsz Yia) 
=end ded tead 
= lea tented 
=d 
在 上 述 推 导 中 利用 了 式 (6-269) 以 及 式 (6-267) 的 条 件 。 色 此 ， 唯 一 的 问题 就 是 由 式 
(6-267) 表 出 的 条 件 在 实际 中 怎样 来 实现 。 其 实 ， 对 于 由 式 〈6-267) 表 出 的 条 件 是 容易 在 实 
际 中 做 到 的 ， 即 只 需 对 混合 物 量 测 谱 兰 G=, 2, 0.0 m) 和 纯 组 分 量 测 谱 共 (it 一 1，2，37 
进行 归 一 化 处 理 就 立即 可 以 得 到 ， 即 令 


Mun Xl G-1, 2, m; j=l, 2, m$ 


= 


由 式 (6-263). HES E RB x 的 所 有 元 素 求 和 可 得 


У) yae У) syte D sutea Ў) Sw (6-271) 
Ж ®л„=1, Ds, =1 的 条 件 ， 立 即 可 得 
lec са (6-272) 


PME (6-267) 表 出 的 条 件 。 

值得 提出 的 是 ， 出 于 纯 组 分 光谱 中 (一 1,2,3) 是 待 求 的 ,所 以 这 一 平面 方程 实际 是 通过 由 
混合 物 光谱 x 二 1,2,…sm) 在 因子 空间 的 坐标 点 集 来 得 到 的 。 从 上 述 讨论 可 知 , 经 归 一 化 处 
US ИЖИ x Gm 1o 2. зз, т) EETA BL E pR В Ga ss sa), GL 2n mE 
SE PETE MC EROR CUR A бил tos (up tts Qi asan) Ж ДК — Y 
É, 在 此 下 标 i、 7、 大 是 属 子 下 标 集 б=1,‚ E m) 中 的 任 一 不 相同 的 三 个 下 标 ， 继 用 下 
式 可 得 由 式 (6-269) 所 定义 的 平面 方程 ， 即 
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ну ну из 


(6-273) 


UaU, Uy Uy, Wu 


шастак Ma uq tg y 

Sharaf 等 就 是 用 此 法 对 两 个 三 组 分 混合 体系 进行 了 解析 . rh Еа SKD Esd R, 
燃 醇 构成 的 三 组 分 泥人 台 体 系 的 纯 组 分 质谱 解析 ， 另 一 个 是 Cr Cu), Co (1), Ni (1) 构成 
的 三 组 分 混合 体系 的 纯 组 分 紫外 可 见 光谱 解析 。 这 两 个 体系 的 各 组 分 浓度 及 它们 的 混合 牺 量 
测 波谱 在 三 维 因子 空间 的 坐标 和 在 二 维 平面 的 坐标 分 别 示 于 表 6-14 MR 6-15, 它们 在 二 维 平 


面 的 投影 图 分 别 示 于 图 6-28 和 图 6-29, 
ROU 10 个 模拟 质谱 混合 体系 的 组 成 .因子 得 分 (a 02,0.) 
Hit MAO LR I 
ҮГҮТҮ 因子 得 分 LARES 
| 3 a 7 5 
1 10 10 80 123. 924 —49.1]2 —14. 726 74. 813 110.723 
2 80 10 10 122. 785 45.947 12.892 20. 306 13. 841 
3 10 80 10 120.969 48. 754 -44.676 107. 938 13.84] 
4 50 50 0 121. 585 1.805 62.594 0.000 
5 9 50 50 122. 398 40.071 101.528 69. 202 
6 50 ° 50 123. 695, 22. 177 38. 934 68. 203 
? 40 о 60 123, 858 14. 246 46. 721 83. 048 
8 30 ° 70 124.021 6.015 $4. 507 96. 884 
9 30 10 60 123. 598 1.736 59. 240 83, 013 
10 40 50 10 123. 436 9.967 | 51. 453 69. 203 
计算 所 得 的 纯 物 种 质谱 
I 100 ° o 122. 882 59.126 53. 633 0. 000 0. 000 
1 0 100 0 120. 287 63.136 61.464 125.188 0. 000 
Li o 0 100 124.509 — 18. 674 —18. 679 77.868 138. 405. 


Ж 6-15 RRA ЖЕНИШ. ATED (a, ,a.,,4,) 和 计算 所 
得 的 二 维 平面 坐标 及 纯 物 种 光谱 


混合 物 编号 | mamme | 因子 得 分 БҮТ 
1 1 1 z y 
1 10 10 80 2.790 0.033 0. 248 0.174 2.405 
2 80 10 10 0.895 — 0.397 = 0, 261 0, O98 0.398 
3 10 80 10 0.751 0. 389 = 0. 294 0.898 0.392 
4 50 50 0 0,530 — 0.014 —6. 350 0. 542 0.096 
5 50 о 50 2.025 一 0 262 0.023 0.024 1.568 
6 0 50 50 1.930 0.302 9. 004 0.579 1.573 
7 25 25 40 1.709 — 0, 043 = 9. 061 C. 298 1.286 
ЕТТУ" 
1 100 0 о 0. 534 一 9. 564 —0. 358 0.000 0.000 
i 0° 100 0 0.331 0.593 — 9. 406 1.176 0.000 
I 0 9 100 23.776 —3. 548 5.832 — 7.198 23.143 


Ж 6-14 和 表 6-15 PEINT SBR Cars wer ua), G=], 2, =", m) 可 由 式 (6- 
264) 求 出 ， 这 是 因为 因子 空间 (qi. qo 0.) 是 相互 正 交 的 ， 
х191= 11919: Tuaqiq 9591 G-l,2,".) (6-274) 
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ШЕЖЕ. A gigi =O. gig. 0, ШИ gigs 


所 以 ша = xq) gis {6-275a) 
ua = xq. /99s (6-275b) 
ta =X 959: (6-2750) 


至 于 怎样 由 因子 空间 坐标 (xn a tug G= 1.2 . 
т) 化 为 二 维 平面 坐标 ,， 则 可 根据 方程 (8-273) 来 进行 . 
或 是 通过 坐标 旋转 ,使 zy 平面 与 由 (6-273) 所 定义 的 平 
面 重合 即 可 得 到 。 
从 图 6-28 可 以 看 出 ,由 点 1"、2*、3° 决 定 的 三 角形 其 
由 质谱 量 测 值 非 负 这 一 约 东 条 件 而 得 到 的 , 而 由 点 1、 2、 
3 则 是 由 浓度 非 负 这 一 约束 条 件 面 得 到 的 ,图 中 的 阴影 部 1 
分 就 表示 三 个 纯 组 分 质谱 的 可 行 解 域 。 Шин a us 
莉 。 有 关 多 组 分 可 行 解 域 的 确定 在 下 一 节 还 将 进行 更 详 LU IE es 
尽 的 介绍 ， 在 此 不 多 讨论 了 。 Bh BEC ARETAN 

从 以 上 讨论 可 以 看 出 ， 自 模式 曲线 分 辩 法 的 关键 就 
是 如 何 从 一 组 混合 物 量 测 光谱 中 找到 各 个 纯 组 分 波谱 的 可 行 解 域 ， 而 且 三 组 分 混合 体系 的 解 
桥 与 两 组 分 混合 体系 的 解析 并 无 本 质 区 别 ， 只 是 在 降 维 处 理 上 更 如 复杂 些 而 已 。 那 么 对 于 
自 模式 曲线 分 辩 法 是 否 可 在 降 维 技术 上 进行 统 .的 处 理 ， 从 而 折 )” 至 更 多 组 分 混合 体系 的 纯 
组 分 波谱 解析 呢 ? 这 正 是 下 一 节 将 要 介绍 的 内 容 。 


0.0 
图 6-29 7 个 紫外 光谱 的 二 维 表示 
A 1.2. 3872 FM, RI. D. ORAL 
图 中 的 阴影 部 分 表示 二 个 组 分 光谱 的 可 行 解 域 


З. 自 模式 曲线 分 辩 的 统一 降 维 处 理 和 可 行 解 域 的 确定 

1985 年 Borgen 和 Kowalski 对 此 问题 进行 了 研究 “1. 对 含 p 组 分 的 混合 物体 系 的 分 辨 担 
出 了 统一 的 降 维 处 理 方法 , 说 明 含 p 组 分 的 混合 物体 系 纯 组 分 波谱 分 辨 的 可 行 解 域 总 可 以 在 
GD 维 超 平面 上 表 出 。 此 外 ,该 文 还 详细 讨论 了 三 组 分 体系 之 可 行 解 域 确定 的 一 般 性 原则 
和 方法 。 本 节 氮 对 这 些 内 容 分 别 加 以 介绍 。 

G) ЛАТА 
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差 阵 正 交 分 解 后 .找到 了 个 抽象 波谱 矢量 (ue go …，9ri， 并 且 还 设 已 对 所 有 的 混合 
EWR x G=1. 2, ++, m) 和 纯 组 分 量 测 谱 s G=1, 2. e, p) Com) HAT 
ABER. EJ 


nQo—l: QSL, 2s a my pods 2.00. m (6-276а) 


2. s =l GSI, 2, re pi i=l, 2, c.m (6-276b) 
下 面 将 看 到 ， 只 需 通过 适当 变换 ， 就 可 将 混合 物 量 测 波谱 种 纯 组 分 量 测 谱 中 元 素 韭 负 的 
约束 条 件 在 ‘p 一 1) 维 的 超 平面 上 .表示 出 。 
首先 来 看 看 在 此 体系 的 任 一 向 量 ( 包 括 混合 物 量 测 撩 量 和 我 们 蓝 找 的 纯 组 分 波谱 矢量 ) 怎 
样 用 (2—1) 维 超 平面 表 出 的 情况 。 因 届 于 该 体系 的 量 测 波谱 矢量 丝 可 巾 p 个 抽象 波谱 矢量 
线性 表示 出 ， 即 


Siagi Higi руб 1000р) (6-277) 
和 
х= наф ln) (6-278) 
再 根据 条 件 之 zx 一 1， 对 的 各 元 素 求 和 得 
Э дутна > qu o » soe de (6-279) 
+ Mad. 则 有 
» uad,—1 (6-280) 
因 第 一 正 交 抽象 波谱 矢量 q, BARES. 所 以 四 ЗЕ, ИБН А, (6-280 变形 为 
аа Q/di) > sad 1га (6-281) 
可 得 i 
sa (1— Уша, d, (6-2820) 
对 于 由 起 (6.277) RR О=1. 2s P), УВЕРАТ, 
i -(1— Хаа) idi (6-282b) 
= 


式 (6-282) HH, 只 要 由 归 一 化 条 件 , A eR S BR Bu, (Ё= 2 n DA uE 
PTR tH ROR р 维 空间 降 至 了 Cp 一 1) 维 。 

(2) 波谱 数值 非 负 约 束 (第 一 约束 ，FIRPOL) 

因 所 求 纯 组 分 波谱 的 强度 和 值 缘 不 可 为 负 ， 此 条 件 可 用 式 (6-283 表示 


54220 (1.2. bii 1.2. (6-283) 
又 因为 
ва Hagi tHig G 1.2...) (6 284) 
pr 
ж tagu fadum tnd (6-285) 


再 将 式 (6-282b》 代 入 式 (6-285). Wf 


s = 1 ia) |a, + ts + = + tug. 


—qu/di— 64.14) > tadi > Padi 
i 


=а„/4 + MIS [gu (аа) га 2:0 (6-286) 
тоба 20, 实 因 第 一 特征 向 量 的 每 一 元 素 都 大 于 零 ， 所 以 对 式 (6-286) MARL a/d Ж 
等 式 不 变 号 ,得 ‚ 
1+ Y Cuda А20 (6-287) 
07да ӘЛ. È 66-287) 则 变 为 
l+ Улы m0 (6 288) 
A (8-288) 中 /为 一 已 知 量 ， 这 是 因为 Ge (6-2. e. p. i=l 2, "", n) 可 由 主 成 分 分 
析 而 得 到 ， 而 且 A= D gw， 式 中 的 未 知 变量 就 只 有 n, (E72. s р, j= ws, р). 为 
气 
(0-1) 维 超 平面 的 约束 条 件 。 至 此 就 完成 了 第 一 约束 条 件 的 降 维 处 理 。 

(3) 浓度 非 负 约束 (第 二 约束 ，INNPOL) 

MA (6-43) 可 知 ， 任 一 该 体系 的 混合 物 波 赠 志 在 正 交 的 抽象 波谱 空间 igi, qi. +. 
а) 中 可 由 点 集 Gus uus ts н), Gel, 2, com) KER, HR BR (6-44a), Aa dE 
(из. t. 4) 的 线性 组 合 ， 只 要 (бы, бе, na) 已 知 ,ww 就 串 唯一 确定 ， 亦 即 混合 物 波谱 ху 
实际 就 可 由 (ша, е, uu) 构成 的 -D 维 超 平面 唯一 确定 . 由 混合 物 波谱 x 点 集 Gas 5 
1,) G= 1, 2, өт) TE Ca— 1 维 超 平面 所 围 成 的 区 域 , 就 构成 了 浓度 韭 负 的 约束 区 域 , Borgen 
等 将 其 称 为 INNPOL。 

如 采用 这 一 统一 降 维 技术 ， 就 可 使 二 组 分 混合 体系 的 可 行 解 域 落 在 一 条 直线 之 上 ， 面 使 
三 组 分 混合 体系 的 可 行 解 域 落 在 ~ 二 维 平面 之 上 。 

对 于 二 组 分 混合 体系 ， 根 据 式 1 十 2) 20, 有 


LA ftp 220 


亦 即 由 
tm—lfs G-1. 2 


来 确定 , 这 几 条 直线 就 构成 了 波谱 数值 非 负 的 约束 条 件 , 而 m RH CHE RT Es G1. 
2, 50, т) 来 表示 出 。 这 样 ， 在 本 章 第 二 节 讨 论 的 图 6-22 变 成 一 条 直线 ， 可 由 图 6-30 示意 


表示 出 。 
对 于 三 组 分 混合 体系 ， 式 (6-288) 变 成 
14 fat that 220 G1, 2e yn) (6-289) 
即 由 式 (6-290) 表 出 的 ”条 直线 
1+ fatat fut =0 (人 一 1.2 vs) (6-290) 


构成 第 一 约束 条 件 的 区 域 (FIRPOL), 而 xr 个 混合 物 波谱 向 量 则 可 由 т 个 点 集 (uo, ua) 
G=1, 2, +, т) 来 表 出 ， 由 此 可 得 到 第 二 约束 条 件 的 区 城 (INNPOL)， 图 6-31 示意 地 表 
出 了 这 一 情况 。 

从 上 述 讨论 可 知 ， 通 过 如 此 降 维 处 理 ， 可 将 p 组 分 体系 降 至 〈p 一 1) 维 空间 来 进行 图 像 
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表征 . 以 获得 p 个 组 分 的 可 行 解 域 ,Borgen Bb Mt ЩЕП ТЇН G IK RAAT THES i. 得 
到 了 三 维 的 可 行 域 图 像 ， 但 是 ， 计 算 和 相应 的 图 像 表 征 也 变 得 更 加 复杂 。 值 得 提出 的 是 ， 如 
内 体系 的 组 分 数 大 于 5 时 ， 即 使 经 如 此 降 维 处 理 亦 难 用 图 像 去 征 出 来 而且， 即使 求 得 了 体 
系 纯 组 分 光谱 的 可 行 解 域 ， 仍 未 得 到 其 有 真实 物理 意义 的 唯一 解 。 可 以 想像 ， 如 果 遵 循 这 一 
思路 继续 研究 下 去 ， 悉 怕 一 时 还 难 十 得 到 可 为 /大 分 析 芽 作者 易于 接受 、 易 于 理解 且 又 今 人 
振奋 的 结果 ， 似 有 必要 开辟 新 的 研究 途 么 。 

随 着 分 析 实 验 室 中 的 色谱 联 用 仪器 的 出 现 和 和 普及， 使 这 样 的 设想 成 为 可 能 。 下 面 我 们 将 
针对 近年 来 专门 针对 二 维 色谱 联 用 仪 所 产生 的 二 维 数据 进行 矩阵 分 辩 的 方法 给 出 详细 的 介 
绍 。 可 以 这 人 么 说 ， 以 下 将 要 介绍 的 黑色 分 析 体系 的 扎 阵 分 辩解 析 方 法 实际 上 都 是 基于 本 节 所 
讨论 的 白 模式 曲线 分 辨 法 ， 唯 一 不 同 的 地 方 是 在 于 它们 喝 多 地 使 用 了 二 维 色谱 联 用 仪 所 产生 
的 二 维 数据 的 特点 .其 中 最 重 归 的 尾 色谱 的 分 离 特 性 而 不 只 是 局 限于 浓度 非 负 、 光 谱 非 负 
的 约束 ， 使 得 直接 快速 解析 复杂 术 知 的 黑色 分 析 体系 出 现 了 新 局 面 ， 同 时 ， 由 干 使 用 了 二 维 
色谱 联 用 仪 所 产生 的 二 维 数据 的 其 他 化 学 特点 .也 使 得 获得 具有 真实 物理 意义 的 唯一 解 成 为 
可 能 ， 取 得 了 令 人 振奋 的 新 结果 ， 为 丰 接 快速 的 解析 复杂 未 知 的 黑色 分 析 体 系 提供 了 一 条 新 
жже. 


可 有 解 域 1 


图 6-30 二 组 分 体系 约束 界 示意 图 he 
mAb RR; 一 一 s fei 图 6-31 三 组 分 含 6 个 混合 物 波 洲 的 纯 组 分 
波谱 可 行 解 域 确定 示意 图 
阴影 部 分 为 纯 织 分 光谱 的 可 行 解 绒 


《二 ) 和 迭代 目标 转换 因子 分 析 法 

(2458) 

迭代 目标 转换 因子 分 析 法 CITTFA) 由 Gamperline 和 Vanteginste 4} B| sr НО, Ж. 
主要 思路 是 利用 主 成 分 分 解 的 抽象 搜 阵 来 进行 迭代 ， 以 求 得 -个 逼近 的 可 能 解 。 实 因 将 XX 逢 
阵 分 解 后 ， 可 以 得 到 两 个 抽象 正 交 第 阵 了 和 产 ， 分 别 构成 了 止 交 且 又 与 纯 浓 度 谱 和 纯 光 谱 张 
成 的 空间 为 同一 线性 空间 ,这样 ， 用 抽象 正安 空 间 来 替代 纯 浓 度 首 和 纯 光 谱 张 成 的 空间 ， 对 
一 初始 矢量 来 进行 选 代 逼 近 ， 以 求 得 一 个 逼近 可 能 解 , 其 实 , 由 Gemperline 和 Vanteginste 分 
别提 出 选 代目 标 转换 因子 分 析 法 之 区 别 仅 在 于 他 们 所 取 的 切 始 选 代 矢 量 不 同 。 

【基本 算法 】 

设 已 通过 某 种 量 测 方法 获得 了 一 个 二 维 数据 矩阵 开 , 并 假设 此 二 维 数据 矩阵 是 双 线 性 的 、 
即 区 的 每 一 列 都 表示 一 个 浓度 分 布 〈 对 于 色谱 数据 就 是 色谱 )， 每 一 行 都 表示 一 个 混合 光谱 。 
采用 主 成 分 分 析 方法 先 对 此 一 维 数据 矩阵 瑟 进 行 分 解 ， 于 是 香 到 

X-TP-FE (6-291) 
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Ap, TAP ARES, ЖН ТЕ ЕЗ, ИТР TT. 有 时 也 把 它们 
分 别称 之 为 抽象 色谱 阵 和 抽象 光谱 阵 ; E DRAE. 39b, WE Lambert-Beer 定律 可 知 ， 

X=CS +E (6 292) 
AP, CH (mXn) 阶 的 真实 浓度 分 布 阵 〈 对 于 色谱 数据 就 是 色谱 )，S 为 OXD 阶 的 真实 
纯 物 种 光谱 阵 。 在 这 里 m 为 色谱 在 保留 时 间 轴 上 的 采样 点 数 .! 为 光谱 的 波长 点 数 , n 为 混合 
体系 的 独立 组 分 数 。 对 照 上 述 式 (6-291) MA (6.292) 可 以 看 到 


CS'=TP'=TRR !P' (6-293) 

即 
C=TR (6-294a) 

和 
S=R P (6-2945) 


AP, RO ex n BD W Pk ese kE РЕ, ET DUE Bhd ro dh OC BERE R 3 EE, 
真实 的 浓度 分 布 阵 和 真实 的 纯 物 种 光 洪 阵 ， 而 这 正 是 所 要 求 的 。 

很 多 基于 自 模式 曲线 分 辩 方 法 的 算法 ， 其 上 月 的 也 就 在 于 找到 这 个 转换 矩阵 R. ROS 
《6-294a) (在 此 只 讨论 浓度 分 布 阵 的 情况 , 对 于 纯 光谱 阵 如 式 (6 294b) 所 示 出 的 情况 与 此 类 
i, JURE 写成 矢量 式 ， 即 
c =Tr, (6 295) 
式 中 , 下 标 i 表示 真实 的 浓度 分 布 阵 的 第 i 列 。 设 已 通过 某 一 方法 得 到 了 a, 就 可 以 很 容易 地 
RAAB RIT BOR PSOE Re BO 08 ЭЖ 

n= TT Te (6-296) 
由 于 全 为 -- 列 正 交 的 矩阵 ， 所 以 TT) 的 求 逆 很 容易 。 在 此 的 问题 是 : c 其 实 是 未 知 的 ， 是 
我 们 最 终 要 求 得 的 。 如 前 所 述 ， 选 代目 标 转换 因 于 分 析 (ITTFA) 的 主要 思路 是 利用 选 代 来 
解决 这 一 矛盾 。 先 找到 一 个 初始 选 代 矢量 c. HÑ (6-296) 算出 一 个 相应 的 下， 青 由 式 《6- 
295) 就 可 得 到 一 个 新 的 浓度 分 布 矢量 ， 记 为 a, 就 此 循环 使 用 上 述 两 式 , 直到 | cf et | 
于 某 一 给 定常 数 ， 即 停止 选 代 ， 由 此 而 得 到 的 cr! 也 就 是 我 们 要 求 的 可 能 解 。 众 所 周知 ， 由 
选 代 法 所 求解 时 ， 初 始 和 迭代 矢量 的 选择 具有 决定 性 意义 。 如 前 所 述 ， 由 Gemperline 和 
Vanteginste 分 别 握 出 选 代目 标 转换 因子 分 析 法 之 区 别 就 在 子 他 们 所 取 的 初始 先 代 矢量 不 同 ， 
在 此 只 介绍 Gemperline 的 方法 , 对 Vanteginste 的 方法 不 详细 介绍 , 只 因 他 是 采用 因子 分 析 中 
的 最 大 方 益 旋 转 法 来 寻找 初始 迭代 矢量 ， 较 为 复杂 ， 且 物理 意义 不 明确 ， 有 兴趣 的 读者 可 参 
阅 文献 [153].(3amperline 的 方法 主要 基于 如 下 事实 , 即 利用 纯 物种 的 浓度 分 布 (尤其 是 对 色谱 
而 言 ) 有 一 个 且 只 有 一 个 极 大 值 的 特点 ,所 以 他 选择 的 初始 迭代 矢量 为 6 一 《00…0100…0)'， 
BS RIOR Se EPRA SOR MRR ARM BARRE, US SRA 
EIER IUS ЖЕЛ AC CAR ЕЭ Ca Н, 0 В] — Pa PR y h AE EE» BA 
W PELLI О АГАЕ A ЖЕН РЕ SR 48 hb ЕЛЕ ДЕЗЕ ЖЕР A u Ж Ex 
ERS ,然后 再 继续 选 代 。 这 一 步 相 当 重要 , 它 可 促进 选 代 朝 真实 纯 物 种 浓度 分 布 通 近 。 

【讨论 了 

对 于 纯 物种 浓度 分 布 的 重 登 程度 不 严重 的 混合 体系 ， 该 法 的 确 可 以 收敛 至 真实 的 纯 物 种 
浓度 分 布 -9, 但 当 纯 物 种 浓度 分 布 的 重 和 程度 严重 时 ,一 般 难 于 得 到 真实 解 ， 只 可 能 是 一 种 
可 能 解 。 当 然 ， 怎 样 找到 更 有 利 的 初始 选 代 矢量 仍 是 一 个 值得 研究 的 问题 ， 本 书 作 者 在 此 方 
面 亦 做 过 一 些 探讨 ， 有 兴趣 的 读者 可 参阅 文献 [155]。 

在 此 ， 分 析 一 下 该 法 的 物理 意义 ， 对 正确 使 用 该 法 和 理解 该 法 的 适用 性 有 帮助 。 该 法 的 
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基础 在 于 它 利用 了 两 个 抽象 正 交 矩 隆 了 和 P' 分 别 

A 构成 与 纯 浓 度 谱 阵 C 和 纯 光 谱 8 张 成 的 空间 为 同 
| pence 一 线性 空间 的 事实 , 所 以 , ATE Ce A T KREA 

Р 小 度 谱 阵 C 以 进行 迭代 逼近 ,是 可 能 求 得 -个 通 近 

| 

1 


可 能 解 的 。 整 个 迭代 过 程 示意 地 由 图 6-32 表 出 , 以 
AATF 帮助 该 者 对 该 法 的 理解 ， 

(=) 渐进 因子 分 析 及 其 相关 方法 

【基本 思路 】 

渐进 因子 分 析 法 的 主要 思路 在 于 它 较 精彩 地 
利用 了 二 维 数据 的 一 个 重要 化 学 特点 ， 即 化 学 物质 
的 在 很 多 情况 中 的 依次 出 现 特 性 , 其 有 这 样 特性 的 二 维 数据 包括 联 用 色 涡 (如 GC-IR, HPLC 
DAD, GC-MS 等 ) 数据 、 滴 定 光谱 数 据 (如 在 不 同 pH 信 的 光谱 )、 动 力学 光谱 数据 等 。 浙 进 
因子 分 析 法 最 初 由 Zubbuhier 和 Maeder 等 提出 15 , 主要 用 来 解决 光谱 滴定 数据 的 问题 , 后 由 


图 6-32 渤 代 目标 转换 因 于 分 析 法 的 
BRE Л. ЛҮ TERT 


Maeder 进一步 拓展 so ， 可 用 于 色谱 分 辨 。 渐 进 因子 分 析 法 的 思路 很 简单 ， 它 利用 主 成 分 
分 析 所 得 的 特征 值 为 其 基本 出 发 点 ， 不 同 之 处 只 是 逐步 渐进 地 延 拓 至 整个 矩阵 ， 从 而 得 到 各 
物种 在 该 数据 矩阵 中 的 出 现 点 和 消失 点 。 

【基本 算法 】 


其 具 体 算法 将 通过 图 6-33 来 解释 。 从 图 6-32 可 以 看 出 ， 它 的 计算 是 由 两 大 部 分 组 成 第 
一 部 分 叫 前 向 计算 , 从 矩阵 的 前 两 行 开始 (这 是 因为 
进行 主 成 分 分 析 至 少 要 两 行 )， 继 采用 逐步 增 大 计算 ЩЕ 
MME TT. HE Ат но рено AA Кы 
主 成 分 , TAPA SEE ЖБИ ан SHOT 
阵 的 主 成 分 , 得 三 个 特征 值 , 仿 此 依次 增 大 子 矩阵 的 
行 数 ， 直 至 计算 完整 个 矩阵 ;第 二 部 分 叫 反 向 计算 ， LLL 
从 矩阵 的 最 后 两 行 开始 ， 仿 第 一 部 分 的 思路 然后 计 
算 含 有 三 行 的 子 矩阵 的 主 成 分 ， 依 次 增 大 子 矩 阵 的 _— 
行 数 , 直至 计算 完整 个 矩阵 。 这样 就 得 到 一 系列 的 特 === 
征 值 ， 如 果 体系 的 组 分 数 为 na， 就 把 Ot) 或 者 是 parm 下 向 计算 
Gets) 个 大 的 特征 值 的 对 数 对 保留 时 间作 图 ， 而 得 
到 各 物种 在 该 数据 矩阵 中 的 出 现 点 和 消失 点 。 当 然 ， 
在 向 此 分 析 之 前 , 组 分 数 为 一般 是 未 知 的 ,所 以 一 
般 是 多 取 几 个 ， 以 免 丢 失 有 用 信息 。 

仍 以 联 用 色谱 的 二 维 数据 为 例 ， 在 图 6-34 中 示 mous 产 进 因子 分 析 法 示意 国 
出 了 一 个 三 组 分 体系 的 渐进 因子 分 析 的 结果 图 ， 从 
图 6-34 可 以 看 出 ， 渐进 因子 分 析 的 结果 在 理想 的 情况 下 是 确实 能 为 我 们 确定 体系 物种 数 ， 及 
确定 各 物种 在 该 数据 短 阵 中 的 出 现 点 和 消失 点 提供 重要 信息 的 。 以 后 还 可 以 看 到 ， 有 了 这 样 
的 信息 ， 将 对 下 一 步 的 纯 光 谱 和 纯色 谱 的 分 辩 提 供 很 大 方便 。 

{讨论 】 

渐进 因子 分 析 法 节能 给 出 这 些 有 用 的 信息 ， 但 是 它 的 计算 量 是 比较 大 的 ， 如 要 完成 一 个 
100% 60 阶 的 矩阵 的 计算 , 大 约 就 需要 几 个 小 时 , 实 因 随 着 矩阵 的 增 大 , 主 成 分 分 析 所 需 时 间 


增加 很 多 ， 而 且 ， 它 的 计算 是 分 两 个 方向 进行 
的 ,是 不 是 存在 一 种 方法 , 它 既 可 得 到 渐进 因子 


Z< 


分 析 法 所 能 得 到 的 信息 ， 又 能 在 几 分 钟 之 内 完 
成 呢 ?答案 是 朋 定 的 ,这 就 是 将 要 介绍 的 固定 尺 
寸 移动 窗口 渐进 因子 分 析 法 。 

MER наи OMEN TELE | 
Keller 和 Massart 提出 ,其 思路 相当 简单 ,与 | 
渐进 因子 分 析 法 逐步 扩大 主 成 分 分 析 窗 口 的 做 | 


保留 时 间 一 一 
反应 计算 结果 前 向 计算 结果 


法 不 同 , 它 却 癌 定 一 个 窗口 的 尺寸 , 只 是 不 断 将 
此 窗口 从 二 维 数据 的 起 点 移 向 终点 ， 从 而 得 到 
一 个 特征 信和 的 对 数值 对 保留 时 间 的 作 图 ， 以 得 


Bg HS] —=- 


图 6-34 渐进 因子 分 析 法 结果 示意 图 


到 二 维 色谱 数据 在 保留 时 间 方 向 的 信息 。 该 法 的 基本 算法 和 所 得 到 的 信息 将 图 示 于 图 6-35. 


从 图 6-35 (а) 可 以 看 出 ， 该 法 的 计算 过 程 为 ; D 


先 选择 一 个 窗口 的 尺寸 ,一 般 为 ?7， 即 选择 


TTTREAR—TTMAs © 用 这 样 的 尺寸 来 做 主 成 分 分 析 ， 可 得 7 个 特征 值 ; Q 如 图 


ба) 


保留 时 间 一 
(b) 


Ш 6-35 ”固定 尺度 移动 窗口 渐进 因子 分 析 法 示意 图 
(а) 方法 的 主要 恩 路 示意 图 ;(b) 为 法 的 结果 示意 图 


的 , 即 所 谓 不 等 性 方差 噪声 的 影响 问题 , 由 于 这 种 


6-35 (a) 所 示 , 依次 移动 这 个 窗口 , 如 先 算 
1~? 行 所 组 成 的 子 矩 阵 ， 然 后 ， 计 算 
2 一 8 行 所 组 成 的 子 矩 阵 ,…., 直 到 计算 到 最 
后 7 fi UR Н T MEB, 这样 就 可 以 得 到 一 
含 ? 个 特征 值 的 系列 ， 将 其 对 相应 的 保留 
时 间 数据 点 作 图 将 得 到 如 图 6-35 (b) Bras 
的 结果 图 Keller 和 Massart 提出 该 法 的 初 
户主 要 是 要 进行 二 维 色谱 峰 的 纯度 检验 ， 
就 如 网 6-35 (b) 所 示 那 样 ， 如 果 该 色谱 峰 
不 纯 ， 在 FSMFEFA 的 特征 值 对 数 图 中 就 
会 出 现 -个 小 峰 ， 这 个 小 峰 的 存在 就 说 明 
存在 着 另 一 种 化 学 物质 ， 实 因 在 此 图 中 第 
一 个 特征 值 表 示 主 要 化 学 物质 的 大 在. 而 
第 二 个 特征 值 大 于 噪声 就 表示 在 它 出 现 的 
区 域 还 存在 着 第 二 个 物种 , 否则 , 这 个 色谱 
峰 始终 只 会 有 第 一 个 特征 值 很 大 ， 而 其 余 
的 特征 值 都 接近 于 噪声 。 

然而 ， 在 使 用 这 一 技术 来 进行 二 维 色 
谱 峰 纯度 检验 时 ， 有 一 点 是 特别 值得 注意 
AOE, 常常 不 能 得 到 正确 的 结论 , A 


体 的 例子 可 参见 文献 [159]。 由 子 在 实际 量 测 数 据 中 经 常 存在 不 等 性 方差 噪声 的 情况 ， 即 量 测 
噪声 随 分 析 信号 大 小 而 变化 ， 例 如 在 紫外 可 见 光 谱 的 量 测 中 ， 量 测 噪声 的 绝对 值 在 一 定 范 转 


中 随 量 测 信号 而 增 大 ， 但 量 测 的 相对 误差 却 相 
DAD 仪器 上 进行 实验 研究 的 结果 证 实 了 这 一 结论 


对 稳定 ，Keller 和 Massart 对 此 在 HPLC- 
。 注 意 到 主 成 分 分 析 有 关 判 别 信号 各 噪声 的 


区 别 是 基于 特征 值 的 绝对 值 的 大 小 ， 而 且 主 成 分 分 析 模 型 也 是 建立 在 等 性 方差 噪声 的 假设 之 


上 的 ， 所 以 ， 在 有 这 种 不 等 性 方差 噪声 存在 时 ， 诗 


成 分 分 析 就 很 难 奏效 了 。 为 此 提出 了 一 个 
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对 二 维 色 谱 数据 的 一 种 预 处 理 方法 、 以 克服 不 等 性 方差 噪声 所 造成 的 困难 。 此 预 处 理 方法 的 
基本 思路 很 简单 , 即 对 那些 处 于 色谱 峰 的 光谱 (就 是 那些 光谱 积分 值 大 于 某 一 给 定 值 " 时 ) 进 
行 降幅 处 理 , 而 这 种 处 理 又 不 影响 数据 原 有 的 线性 结构 , 不 至 于 影响 下 一 步 的 主 成 分 分 析 , E 
可 由 式 (6-207) 表示 出 。 


Z= Gn Dede (Ха, > а) (6-297) 
; Xp. OR а ; 行 第 
° j 列 的 元 素 . m Fy AO ЫЙЫК. 

£ = ERE T SE ВИКИ НЕ oi 
з TES GRUB ЖО a, вая, REUS 
р eS RS Mae DUR Т.Ш 6-36 示 出 了 这 
6 — 3 4 36 65 75 Š 样 的 实例 。 经 这 样 的 预 处 理 , 我 们 对 一 药 
he 物体 系 进行 纯度 检验 的 结果 表明 、 用 
4 FSMWEFA TRH 0. 296 0 SEL HT 

2 详细 的 讨论 请 参看 文献 [161]。 
= -2 还 有 一 点 在 此 值得 提出 的 是 ,实际 上 
š 24 FSMWEFA 不 只 限于 二 维 色 谱 峰 的 纯度 
-8 检验 , 它 也 可 像 渐进 因子 分 析 法 那样 用 于 
Ku m 48—45- 39-39-38 — o 一 般 的 多 组 分 体系 ,这 在 本 章 第 五 节 还 会 
ин 详细 地 进行 讨论 。 这 样 的 一 种 改进 看 起 来 
" 很 一 般 ， 可是， 它 却 把 整个 计算 的 时 间 大 
-1 大 缩短 ， 实 因 它 的 主 成 分 分 析 〔 就 用 
£ -3 МАТАН 软件 所 提供 奇异 值 分 解 算法 可 
总 -中 直接 计算 ) 计算 始终 是 针对 一 个 很 小 的 子 
a ‚ иш. 这样， 完成 一 个 二 维 色谱 数据 的 计 
0710207 ю 4 95 6 7 9 算 一 般 只 需要 几 分 钟 ,从 以 后 的 讨论 我 们 
© 还 可 以 看 到 , 它 不 但 可 以 得 到 和 渐进 因子 


ЯТ (ЕРА) 同样 的 信息 ， 而 且 从 某 种 

图 6-36 ”两 个 药物 异 构 体 混合 体系 〈 两 色谱 峰 的 分 离 ”角度 来 说 ， 是 更 准确 、 更 可 靠 的 信息 ， 实 
度 为 0.5; 含量 少 的 组 分 为 含量 高 组 分 的 0.702 该 法 实质 上 用 的 是 一 种 局 部 主 成 分 分 
наа 
Bud Ваа EO ES CDU nid 


从 图 可 看 出 有 四 个 特征 值 大 于 基线 水 平 : : š ИШ 
O 数据 经 平方 要 转换 处 理 后 的 将 征 值 的 对 数 对 保 贸 时 间 = 论 的 主 成 分 分 析 法 )， 以 后 还 会 进行 详细 
ALN. 从 图 夏 出 只 有 一 个 特征 值 大 于 基线 水 平 ; vie. 
(c) 数据 经 式 (6-297) 处 理 后 的 特征 值 的 对 数 对 保留 时 间 (四 ) 窗口 因子 分 析 法 
变化 图 ， 从 图 可 看 出 只 有 两 个 特征 值 大 于 基线 (EKER) 


ASE, FARM 0. TOSS КИНЕ 8 H E T A) СИРА) 由 


Malinowski 提出 ce5, 其 主要 思路 是 利用 一 个 只 有 (x 一 1) 个 物种 的 “窗口 ”, 从 而 求 出 那 第 4 个 
物种 的 纯色 谱 来 ， 此 思路 可 由 图 6-37 简要 示 出 。 

为 便于 理解 , 在 此 仍 采用 前 几 节 所 采用 的 符号 BARRERA X, 用 主 成 分 分 析 方法 
对 此 二 维 数据 矩阵 进行 分 解 可 得 到 
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Х=ТР+Е= DP (6-298) 


KCN 
另外 ， 根 据 Lambert-Beer 定律 可 知 ， a- DASE aasa 
X=CS'+E= Noe (6-299) 
«i 
式 中 ,为 体系 的 组 分 数 。 因 为 了 和 C、P 和 STR 
$' SOR Stee А], Вл, A | ША — 
«= У) ви, (6-3002) 色谱 保留 时 间 
n Bs 窗口 因子 分 析 法 主要 思路 示意 图 
或 s= Map (6 300b) 
= 


Җир, SF w 分 别 为 线性 组 合 系数 。 
现 设 X 为 只 含 (n 一 1) 个 组 分 的 二 维 数据 矩阵 六 的 一 个 子 矩阵 ， 为 方便 起 见 ， 就 为 只 售 
了 前 (#—1) 组 分 ， 经 主 成 分 分 析 可 得 到 aD EARR, Bj 


x=T°p"+E= DE (6-301) 
式 中 ， 用 了 标 0 来 表示 这 些 正 交 矢 量 ， 是 说 明 所 与 不 同 。 同 式 〈6-300)， 有 
= ina 或 «= Sine А (6-302) 


在 此 与 式 《6-300) 不 同 的 是 , 式 (6. 302) 表 出 的 只 TM 一 个 (aD Hl X WF, ША 
将 那 包 括 在 此 区 域内 的 《n 一 1) 物种 。 PEE, R (6-302) TUM Bn RB, BIG SEHR 
到 一 个 与 成 Gal. =, п—1) ERWRE pl. MA 


= Dano (6-303) 
因为 py 的 正 交 性 ，t, 很 容易 求 出 ， 即 
x= pi (6-304) 
问题 是 如 何 来 求 出 pi? 对 式 (6-303) PA р. ЖАП. WA 
Ув DI SP => [Sede (6-305) 
对 式 (6-305) 进行 重 写 ， 可 得 ` т 
St pie У) | Jeph) = (Sele! КГГА (6-306) 
于 是 有 ü m m 
P - Ув _ УЧ Ук) (6-307) 


实际 上 , A 6-307) 就 给 出 了 一 个 求 得 pr 的 方法 ， 实 因 该 式 右边 的 所 有 量 都 为 已 知 量 或 


BORE, MEAR (Ye) MM 


п 维 正 交 空间 р; (j 一 1，…， 
ЖЖ p G51, + 
所 以 有 


sn) ЖЖ р, Gal, 


只 是 一 个 正规 化 常量 。 

这 样 得 到 的 由 (x 一 1) 维 子 空 间 拓 广 而 得 的 正 交 空间 p G=1, + 
п) 可 以 相互 线性 表 出 ,所 以 它们 实际 上 张 成 同一 空间 。 于是, 无 
‚ n) 来 表示 该 体系 的 纯 物种 光谱 都 是 可 行 的 。 


эл), Ñ 


与 原始 的 
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s= > um (6-308) 
将 式 (6-308) КАЖ X= > esi 可 得 


x= Èe LS m= УУ) yep! (6-309) 
fest (6-300) eh C HERR 2 PER ДЕНЕ, 对 式 (6 309) BHiAZESÉ ph. Fi 


SD rapip (6.310) 


= = 


fi E кул, DEER M ос lesa DAAB 
Xpi=| > 7с) рур} (6-311) 


BA st (їй ДУР п Ph, Рр ФЕР BEBLAR EAB Ол 7 1) PPI os BROT DE BE On D p? Ж 
线性 表 出 [参看 (6-302) 式 ], 此 时 就 有 7。 对 除外 的 所 有 ,来 说 部 等 于 零 , 只 有 s; 需要 р! 的 线 
性 组 合 得 到 ,同时 是 可 以 归 一 化 的 ,这 样 

Xp. =Y,,e, (6-312) 
ADS pe 左 乘 整个 矩阵 下 时 ,就 可 以 得 到 с, 与 一 常数 因 于 HRA. WHE 
到 了 纯 物种 z 的 纯色 谱 , 将 其 归 一 化 即 可 得 到 归 一 化 的 色谱 了 , 仿 此 对 其 他 (n 一 1) 个 物种 同样 
处 理 , 只 要 可 以 找到 一 个 只 含 不 包括 要 找 的 色谱 在 内 的 其 他 (2 一 1) 个 物种 存在 的 区 域 ,或 称 窗 
日 ,就 可 以 将 这 ?= 组 分 的 体系 进行 唯一 的 分 辩 结 果 

【基本 算法 】 

从 上 述 讨论 可 知 ， 窗 口 因 于 分 析 法 (WFA) 的 具体 算法 可 由 下 述 几 步 组 成 ， 

(D WEAR (2 一 1) 个 组 分 的 二 维 数据 矩阵 多 的 一 个 子 夭 阵 , 一般 可 用 前 节 讨论 的 固定 
尺寸 移动 窗口 渐进 因 于 分 析 法 或 特征 结构 跟踪 分 析 ， 更 准确 地 得 到 在 保留 时 间 方 向 上 的 化 学 
秩 图 来 确定 。 

@ 用 式 (6-307), Bp 


S prs 
Э 用 式 !6-312), 即 
Xpi—Y.e, 
即 可 求 得 с, Ж. 
OE3D-QE. HERMAN о G=1, 2. o0. ЕЛЖ ООН SADR 
光谱 ， 即 


S-(CCO CX 
Malinowski 将 WFA 对 Gemperline 和 Hamilton 所 做 的 一 套 流 动 注射 分 析 的 有 关 七 种 不 
同 钞 络 合 离子 数据 "5 进行 了 分 辨 ， 得 到 满意 的 结果 ， 有 兴趣 的 读者 可 参阅 文献 [162] 。 
Ch) 直观 推导 式 演进 特征 投影 法 
从 前 几 节 的 讨论 中 可 以 看 到 ， 选 代目 标 转换 因 于 分 析 法 〈ITTFA)、 渐 进 因 于 分 析 法 
(EFA)、 固 定 尺寸 移动 窗口 渐进 因 于 分 析 法 (FSMWEFA) 以 及 窗口 因子 分 析 法 (WFA) 这 
些 方法 都 是 在 利用 二 维 色谱 的 某 些 化 学 特征 来 进行 解析 ， 实 际 上 它们 都 没有 完全 利用 二 维 色 
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谱 数 据 的 化 学 特征 , 而 直观 推导 式 演进 特征 投影 法 CHELPO 方法 则 旨 在 充分 利用 二 维 色 谱 数 
撕 的 所 有 化 学 特征 。 所 以 ， 我 们 在 讨论 HELP 方法 之 前 ， 似 有 必要 丈 二 维 色谱 数据 的 所 有 化 
学 特征 进行 剖析 ， 以 便于 读者 对 该 法 的 理解 。 

因 二 维 色谱 数据 具有 以 下 对 分 析 化 学 特别 有 用 的 6 个 主要 化 学 特征 ， 所 以 它 可 为 分 析 化 
学 家 们 提供 机 会 ， 从 而 使 得 用 二 维 色谱 数据 解析 最 困难 的 黑色 分 析 体系 成 为 可 能 。 以 下 将 对 
它们 一 一 加 以 详细 讨论 。 

(D 二 维 色谱 数据 同时 包含 了 光谱 与 色谱 信息 。 一 般 说 来 光谱 《如 质谱 、 红 外 光谱 ， 蛇 外 
TRIES) 能 提供 化 学 物质 的 大 量 定性 信息 ， 而 色谱 则 能 提供 定量 信息 ， 如 果 条 件 控制 得 
好 ， 化 学 物质 的 保留 时 间 对 化 学 物质 的 定性 也 是 很 有 帮助 的 ， 这 说 明 二 维 数据 与 通常 的 一 维 
数据 相 比 - 可 多 提供 很 多 新 信息 ， 为 分 析 化 学 家 提供 了 新 的 机 届 ， 也 就 是 说 ， 我 们 可 以 同时 
在 光谱 或 色谱 空间 来 研究 我 们 的 样本 ， 为 我 们 直接 用 这 样 的 仪器 来 解析 复杂 的 多 组 分 分 析 化 
学 体系 提供 了 机 会 。 

D 色谱 仪器 具有 很 强 的 分 匈 能 力 , 它 可 将 一 个 很 复杂 的 分 析 体系 分 解 成 为 多 个 相对 简单 
的 子 体系 、 这样， 也 就 为 分 析 化 学 工作 者 提供 一 种 很 有 用 的 将 复杂 体系 变 为 简单 体系 的 工具 
和 思路 ， 使 我 们 有 可 能 只 需 直 接 处 理 这 些 相对 简单 的 体系 或 子 矩阵 df ERE ELO CE E 
来 解析 复杂 的 多 组 分 分 析 化 学 体系 。 

O 纯化 学 物种 的 色谱 峰 有 一 个 也 只 有 一 个 最 大 峰值 这 一 化 学 数据 的 特点 , 可 为 我 们 在 
进行 数据 处 理 和 分 析 时 带 来 有 用 信息 。 

CD. 化 学 物质 在 色谱 仪 中 流出 时 ,不 司 的 化 学 物质 是 依照 某 种 化 学 规律 依次 流出 和 依次 消 
失 的 ， 这 一 特点 ， 就 像 我 们 在 前 几 节 的 讨论 的 那样 ， 为 俩 定 某 一 物质 的 色谱 保留 时 间 存 在 区 
间 带 来 很 火 方便 。 

O 在 二 维 色谱 数 据 中 ， 经 常 很 容易 找到 所 谓 的 零 组 分 区 ， 即 在 一 段 保留 时 间 区 域内 没有 
任何 化 学 物质 流出 ， 正 是 这 样 的 零 组 分 区 域 ， 为 我 们 直接 提供 了 在 这 一 样本 运行 条 件 下 的 仪 
器 噪声 或 仪器 背景 的 有 用 信息 ， 这 -~- 信 息 将 为 我 们 确定 体系 的 化 学 组 分 数 ， 即 将 分 析 信号 与 
噪声 的 分 离 和 区 别 ， 提 供 重要 信息 ， 此 外 ， 如 果 体 系 存在 某 种 背景 ， 零 组 分 区 域 的 信息 ， 也 
将 直接 为 我 们 提供 有 用 的 仪器 背景 信息 。 

© 一 般 二 维 色谱 数据 都 是 非 负 实数 ， 像 我 们 在 本 章 第 一 节 中 看 到 的 , 这 一 条 件 将 为 我 们 
提供 很 有 用 的 约束 条 件 ， 从 而 大 大 缩小 了 搜索 空间 。 

有 了 这 样 的 前 提 ， 再 来 看 一 看 黑色 分 析 体系 的 数学 模型 ， 即 

X=CS+E 
BATU EUR. ER Pt EX, 而 对 于 C BUS! 都 一 无 所 知 ,此 外 ,就 是 对 C MS 中 
各 有 多 少 行 与 多 少 列 , PB = 为 几 也 是 未 知 的 。 这 样 的 问题 在 数学 上 称 为 矩阵 反问 题 ， 一 般 说 来 
是 不 可 能 存在 唯一 解 的 ， 除 非 预 先 有 一 定 特 殊 条 件 ， 这 在 讨论 自 模式 曲线 分 辩 方 法 时 就 已 经 
看 到 ， 如 果 只 用 到 浓度 非 负 和 波谱 量 测 值 非 负 的 条 件 ， 最 多 就 只 能 得 到 可 能 解 。 从 这 一 角度 
来 看 ， 上 述 提出 的 二 维 色谱 数据 的 化 学 特征 就 显得 十 分 重要 了 。 

直观 推导 式 演进 特征 投影 法 (HELP》 由 本 书 作者 与 Kvalheim 共同 提出 中 , CRRA 
一 种 之 步 的 推导 式 方式 来 解析 二 维 色谱 数据 ， 反 自 模式 曲线 分 辨 法 仅 基于 全 局 主 成 分 分 析 的 
思路 , 它 主 要 基于 局 部 主 成 分 分 析 中 ,以 尽量 利用 色谱 的 分 离 特性 来 获得 各 于 矩阵 的 有 用 信 
息 ， 其 中 最 重要 的 是 所 谓 选 择 性 信息 ， 在 此 基础 上 ， 它 试图 根据 色谱 流出 数据 特性 来 获得 在 
色谱 保留 时 间 方 向 上 的 所 谓 “ 秩 图 ”, 实际 上 就 是 色谱 保留 时 间 方 向 上 组 分 分 布 图 ; 然后 根据 
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秩 图 和 所 得 的 选择 性 信息 来 对 重 公 的 色谱 或 光谱 进行 满 牧 分 解 ， 以 获得 唯一 解 。 以 下 将 对 
HELP 方法 提出 的 一 些 基本 概念 和 解析 手段 作出 较 详细 的 讨论 。 
【基本 概念 与 基本 过 程 了 
L 演进 特征 投影 图 和 选择 性 信息 
所 请 演进 特征 投影 图 实际 就 是 主 成 分 投影 图 。 首先 对 二 维 色谱 数据 进行 主 成 分 分 析 
(或 就 是 进行 奇异 值 分 解 分 析 )、 然 后 从 两 个 空间 ， 即 所 谓 的 色谱 空间 和 光谱 空间 ， 用 第 一 主 
成 分 对 第 二 主 成 分 作 图 ， 这 样 就 可 以 得 到 很 多 的 有 用 信息 。 在 讨论 这 些 有 用 信息 之 前 ， 有 必 
要 首先 来 讨论 一 下 一 维 色 诺 数据 的 特点 以 及 此 时 采用 特征 投影 图 的 矢量 代数 的 基础 和 整体 优 
越 性 。 二 维 色谱 数据 实际 上 是 由 两 个 高 维 的 
坐标 ， 即 光谱 的 波长 空间 坐标 和 色谱 的 保留 
时 间 空 间 举 标 来 决定 ， 联 用 色谱 二 维 数据 的 
wem 7s 每 一 个 光谱 点 ， 即 一 维 数据 中 的 每 一 行 ,都 可 
"E || 由 波长 坐标 空间 的 一 个 矢量 来 决定 ， 不 同化 
P xm 学 物质 的 光谱 在 此 波长 坐标 空间 部 具 有 不 同 
的 位 置 。 一 般 说 米 , 任 一 高 维 空间 的 矢量 可 完 
| | 余 由 其 在 该 空间 的 方向 和 大 小 来 唯一 确定 
这 为 我 们 用 矢量 来 讨论 二 维 色谱 数据 提供 了 
很 大 方便 , 也 就 是 说 , 只 要 知道 了 该 矢量 的 大 


à LEM 小 和 方向 也 就 完全 确定 了 该 矢量 , 同 理 , 对 于 
эки 联 用 色谱 二 维 数据 的 每 一 个 色谱 点 ， 即 二 维 
数据 中 的 每 一 列 ， 都 可 由 保留 时 间 坐标 空间 
x m 
a 


2 ”的 一 个 矢 车 来 决定 ， 不 同色 谱 在 此 保留 时 间 
“ doo RAL ARLE RIT H 
uud * BRIAN 图 6-38 形象 地 表 出 。 这 样 ， 对 于 二 维 色谱 数 
_ on E, 采用 矢量 来 讨论 它们 之 间 的 关系 将 丰 且 
mananan AER ram 于 对 其 内 在 结构 的 理解， 这 也 就 是 我 们 运用 
二 维 色 计数 据 抑 阵 中 的 行 矢量 孝 吕 该 长 空间 中 的 矢量 特征 投影 图 来 帮助 解析 二 维 色谱 数据 的 
二 维 色 谱 数 据 抑 阵 中 的 列 矢 最 都 是 保留 时 间 空间 中 的 矢量 ”初衷 。 
另外 . 在 矢量 空间 中 , 一 个 矢量 的 决定 因 
素 在 于 其 方向 ， 即 如 果 它 的 方向 已 经 确定 ， 它 就 可 唯一 地 在 此 高 维 空间 中 被 确定 ， 或 者 用 化 
学 的 语言 来 说 . 就 是 同一 种 化 学 物质 , 它 的 光 冀 在 高 维 波长 空间 中 就 主要 由 其 方向 来 确定 , Y 
向 定 了 光 溢 也 就 唯一 确定 了 ， 其 大 小 只 反映 该 物种 的 银 度 。 所以， 如果 该 空间 只 存在 一 个 化 
物质 ， 其 光谱 矢量 在 波长 空间 中 就 始终 在 条 通过 原点 的 直线 中 变化 . 实 因 其 方向 始终 不 
变 。 如果 把 这 些 矢量 都 看 成 是 高 维 波长 空间 的 一 系列 点 列 而 连 起 来 ， 它 们 将 就 是 一 条 通过 原 
点 的 直线 段 。 注 意 到 这 样 的 结论 对 色谱 保留 时 间 空间 也 是 同样 适用 的 ， 所 以 ， 我 们 可 以 从 机 
个 方向 来 讨论 二 维 色 请 数据 。 图 6-39 和 图 6 40 分 别 示 出 了 在 波长 空间 和 色谱 保留 时 间 空间 
存在 选择 性 信息 的 情况 。 
如 前 所 述 。 所 谓 演 进 特征 投影 图 实际 就 是 主 成 分 投影 图 ， 在 此 将 就 主 成 分 投影 图 怎样 反 
映 上 述 高 维 空间 的 矢量 特性 来 进行 必要 的 说 明 。 所 谓 主 成 分 分 析 ， 实 质 上 就 是 对 二 维 数 据 进 
行 奇异 值 分 解 《参见 第 十 一 章 )， 即 


a 
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X=UGP'=TP' (6:313) 

Xp. U AIEEE, RARER. TAU 和 G 的 乘积 , 实际 上 它 的 性 质 与 如 基本 一 

St; GH RAS, WRT XR. RSH КТЕ. 是 马 和 矩阵 的 协 方 

差 阵 所 得 特征 值 的 平方 根 ; P AI EZER, ER TAPE. AIR P 的 正 交 性 对 式 《6- 
313) 两 边 同 时 右 乘 P， 则 可 得 

XP=T ЕА GPS, (6-314) 


ик tk 
I j 


| 


as 


保留 时 间 空间 
图 6-40 色谱 保留 时 间 空 间 的 选择 性 信息 


波长 空间 
В 0-39 ”光谱 波长 空间 的 选 样 性 信息 


X E. R (6-314) BO Pe X 的 每 一 个 行 矢量 x, (或 者 说 每 一 个 光谱 ) 投影 到 正 
CRAP ZE, 就 得 到 了 得 分 矩阵 , 所 以 得 分 矩阵 实际 上 就 反映 了 光谱 之 间 的 相互 关系 。 
AB, RET 的 正 交 性 对 式 (6-314) 两 边 同时 左 乘 下 ， 则 可 得 

ТХ=Р 或 T'x,= р (6-315) 
MERRER X 的 每 一 个 列 矢 量 x, (或 者 说 每 一 个 色谱 ) BL BERE APR PET" ZE, ЖШ 
RARE, ALA, ЯТ ЕРЕК ER RAT RBS MRK. RE ， 就 可 以 在 低 维 
空间 来 直接 观察 高 维 光 谱 和 色谱 之 间 的 相互 关系 了 。 在 演进 特征 投影 图 中 ， 一 般 都 只 需 取 两 
个 特征 矢量 来 作 配 就 够 了 ， 当 然 ， 如 果 能 用 三 维 的 特征 投影 图 应 可 得 到 更 形象 的 信息 。 

在 此 特别 提出 ， 由 于 色谱 的 依次 流出 的 性 质 ， 而 使 得 二 维 色谱 数据 具有 一 个 很 重要 的 特 
点 ， 即 如 果 用 曲线 将 这 些 投影 点 列 连 起 来 ， 我 们 就 可 以 很 容易 地 得 到 在 二 维 色谱 数据 中 的 各 
化 学 物种 依次 流出 的 信息 ， 这 也 是 我 们 将 其 称 为 演进 特征 投影 图 的 初衷。 总 的 说 来 ， 利用 演 
进 特征 投影 图 ， 可 以 很 容易 地 得 到 以 下 有 用 信息 : 

CD 色谱 和 光谱 空间 的 选择 性 信息 。 特征 投影 图 中 经 延长 可 通过 原点 的 直线 (基于 最 小 二 
乘 意义 的 ), 就 代表 色谱 和 光谱 空间 的 选择 性 信息 ， 用 化 学 的 语音 来 说 就 是 所 谓 单 组 分 区 。 得 
分 投影 图 中 显示 的 通过 原点 的 直线 段 就 表示 在 色谱 (保留 时 间 方 向 ) 空间 中 存在 善 选择 性 信 
息 ， 亦 即 在 保留 时 间 的 某 一 区 域 是 纯 组 分 区 ， 从 这 里 取出 的 光谱 一 定 是 某 一 种 化 学 物质 的 纯 
光谱 ; 同 理 ， 载 荷 投影 图 中 显示 的 通过 原点 的 直线 段 就 表示 在 光谱 (波长 方向 ) 空间 中 存在 
着 选择 性 信息 ， 亦 即 在 波长 的 某 一 区 域 是 纯 组 分 区 ， 从 这 些 波 长 中 取出 的 色谱 一 定 是 某 一 种 
化 学 物质 的 纯色 谱 。 图 6-41 和 图 6-42 分 别 示 出 了 一 个 两 组 分 体系 和 三 组 分 体系 的 特征 投影 
图 的 例子 。 这样 的 特征 投影 图 很 重要 ， 据 此 可 以 很 容易 的 找到 色谱 和 光谱 的 选择 性 信息 ， 也 
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就 是 说 ， 在 此 充分 地 利用 了 一 维 色谱 数据 的 分 离 性 质 。 


Д 


o 
° 20 40 60 250 260 270 280 290 
tafs 波长 /nm 
(a) (b) 
0.4 | 9.4 ] 
o. 24 b | 0.2 
5 
Qi o 
3 El 
g 
-o,2L a -0.2 
-0.4 RUN 1 -0.4| А 
0 0.1 6.2 0.3 0.4 -0.2 -0. ò 
PC, PC, 
(o) (d) 


Шеп 模拟 2 组 分 体系 及 其 特征 投影 图 
(а) BAAR A. Cb) КЕЧЛЕ 
(с) 波长 空间 的 特征 投影 图 ，(d) 保留 时 间 空 间 的 特征 投影 图 
图 中 标 出 的 a、 部 分 为 体系 的 选择 性 信息 .从 图 中 可 以 看 
出 ， 这 样 的 选择 性 信息 可 由 特征 投影 图 的 直线 段 中 找 出 


o 


250 260 270 280 290 
RK/nm 
(b) 


CERO 63 о 
РС 
(4) 


图 6-42 模拟 3 组 分 体系 及 其 特征 投影 图 
а) 模拟 体系 三 个 纯 组 分 色 谐 ，(P) 模拟 体系 三 个 纯 组 分 光谱 ， 
(c) 波长 空间 的 特征 投影 图 : (d) 保留 时 间 空 间 的 特征 投影 图 
图 中 标 出 的 a. b 部 分 为 体系 的 选择 性 信息 ， 从 图 中 可 以 有 出， 与 2 组 分 体系 相 比 ， 
3 组 分 体系 困 光 谱 重 登 比 ?组 分 严重 ， 已 难于 找到 选择 性 信息 


D 体系 中 各 组 分 流出 情况 及 其 数目 的 确定 信息 .注意 到 不 同 的 化 学 物种 在 演进 特征 投影 
图 中 都 具有 不 同位 置 (或 不 同方 向 ) ， 所 以 ， 当 一 种 新 的 化 学 物种 出 现 的 时 候 , 如 果 它 为 第 一 
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个 ， 则 为 -从 愿 点 出 发 而 不 断 增 大 的 直线 ， 而 当 此 物种 是 第 二 或 更 后 才 流 出 来 的 ， 则 会 在 演 
进 特 征 投影 图 上 与 第 一 物种 的 点 列 形成 各 种 曲线 ， 从 而 为 我 们 提供 体系 各 物种 依次 流出 的 信 
В (参见 图 6-41 和 图 6-42)。 这 种 信息 不 但 对 体系 的 组 分 数 确 定 具有 一 分 重要 的 意义 , ША, 
它 还 再 以 用 来 区 别 不 同 的 流出 模式 ， 这 样 的 例子 示 于 图 6-43， 这 也 是 为 什么 将 此 特征 投影 图 


称 为 演进 特征 投影 图 的 原因 。 


[TT 保留 时 间 保留 时 间 


吸光 度 
RHE 
BER 


PC, 

(OR 
" 

PG 


J| L ~ - - a 


РС, РС, PC, 
6-43. 3 种 不 同 的 大 色谱 峰 包 小 色谱 峰之 模式 及 其 相应 特征 投影 图 


@ 二 维 色谱 数据 的 背景 信息 。 如果 二 维 数据 中 不 存在 有 篆 景 , 则 零 组 分 区 的 投影 点 应 收 
伍 于 投影 图 中 的 原点 ， 反 之 ， 如 果 零 组 分 区 的 投影 点 不 收敛 于 原点 ， 则 说 明 数 据 中 存在 着 背 
景 ,在 做 进一步 的 分 析 之 前 必须 想法 扣除 背景 的 影响 ( 详 见 以 后 的 讨论 )。 在 图 6-44 中 我 们 示 
出 了 这 样 的 一 个 例子 。 这 是 因为 如 果 零 组 分 区 的 光谱 为 很 小 的 服从 正 态 分布 的 误差 矢量 ， 则 
其 投影 点 相对 子 含有 某 种 结构 的 光谱 所 代表 的 投影 点 一 定 在 数值 很 小 且 随 机 地 收敛 于 原点 。 
所 以 ， 这 样 的 特征 投影 图 就 为 我 们 提供 了 一 个 方便 的 检测 在 二 维 色谱 数据 中 是 否 存在 背景 的 
TH. 


9.632 о. 0687 


g g 
= 0,032 -0.068 
一 -5.253 5.253 
5,276 PC, 5.276 РО 
(а) (b) 


图 6-44 叶 绿 察 a 降解 混合 物 的 特征 投影 图 
GO) 在 背景 扣除 前 的 特征 投影 图 〈 零 组 分 区 的 光谱 投影 远离 投影 芭 原 点 ); 
(b) 在 背景 扣除 后 的 特征 投影 图 〈 零 组 分 区 的 光谱 投影 此 收 敏 于 投影 图 原点 ) 


2. 特征 结构 跟踪 分 析 与 秩 图 
特征 结构 跟踪 分 析 -实际 上 是 对 固定 尺寸 移动 窗口 浙 进 因子 分 折 法 (FSMWEFA) 的 一 
种 拓 广 。 如 前 所 述 , FSMWEFA 可 明显 提高 EFA 的 运算 速度 , 且 可 同样 提供 我 们 所 需要 的 各 
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组 分 在 保留 时 间 方向 上 的 分 布 信息 , 但 是 ， 
果 只 将 FSMWEFA 用 于 色谱 峰 的 纯度 检验 四 


га 


ER TAB Р — EME. R. Rn 
‚ 固定 窗口 的 尺寸 并 不 重要 ， 
一 技术 来 获取 各 化 学 组 分 在 保留 时 间 方向 上 的 分 布 信息 的 话 ,窗口 大 小 的 选取 就 十 分 旨 


但 是 如 果 想 通过 这 
EET. 


实际 上 ， 可 以 这 样 认为 ， 移 动 窗口 的 大 小 是 与 其 检测 的 敏感 度 和 选择 性 息息相关 的 ， 一 般 说 


来 ， 如 移动 窗口 尺寸 大 一 些 ， 它 的 检测 第 二 组 分 的 敏感 度 也 相对 高 一 


[TIT] 
(a) 


BETTE 
(b) 


В 6-25 叶绿素 a 降解 混 台 物 的 符 征 
EI pp 
(a) 为 窗口 尺寸 为 2 的 跟 逊 分 析 图 ， 
АЙНИ, В, С, р. ЕЖЫ, 
(b) 为 窗口 尺寸 为 3 ARRAN ЕШ. 
其 中 忆 区 己 明 显 不 是 选择 性 区 域 了 


些 ， 而 其 检测 单 组 分 区 
《选择 性 区 域 ) 的 选择 性 则 越 小 。 如 一 个 单 组 
分 区 仪 含 两 个 保留 时 间 点 ， 用 包含 三 个 保留 
时 间 的 移动 窗口 就 会 将 此 有 用 的 单 组 分 区 域 
漏 掉 . 这 样 的 例子 未 于 网 6-45。 如 果 说 选择 性 
信息 对 二 维 色谱 数据 的 分 辩 具 有 很 重要 的 意 
义 的 话 (这 点 将 于 以 后 给 予 详细 讨论 ), 那 
么 从 最 小 可 能 的 窗口 来 使 用 这 一 技术 就 | 分 
重要 了 . 特征 结构 跟踪 分 析 CET A) 的 提出 就 
正 是 建立 在 这 一 基础 之 上 ， 它 从 窗口 等 于 下 
个 保留 时 间 点 开始 进行 移动 计算 ， 然 后 增 大 
窗口 斥 寸 为 三 , 再 进行 一 次 移动 计算 ,一 般 说 
来 ， 只 要 窗口 尺寸 的 大 小 与 该 体系 中 重合 峰 
中 的 组 分 数 相当 时 , 计算 即 可 停止 。 在 此 , 值 
得 提出 的 是 ， 移 动 窗口 的 大 小 选择 还 与 色谱 
分 辨 率 或 色谱 采样 点 的 琉 密 有 关 , 所 以 , 窗口 
尺寸 的 大 小 还 需 根据 具体 数据 情况 而 定 ， 切 
不 可 简单 使 用 一 个 尺寸 ， 由 此 我 们 将 可 得 到 
~… 个 组 分 在 保留 时 间 方向 上 的 分 布 信息 图 ， 
称 之 为 “化 学 秩 图 ”， 据 此 可 将 整个 保留 时 间 
轴 上 的 按 重 登 的 化 学 组 分 数 分 成 不 同 的 区 
域 .这 样 产生 出 来 的 秩 图 将 示例 于 图 6-46。 这 
样 得 到 的 秩 图 很 重要 ， 这 是 因为 据 此 可 以 充 


分 利用 色谱 的 分 离 特 性 〈 二 维 色 谱 数据 的 第 二 特点 )。 


3. 零 组 分 区 和 二 维 色谱 数据 的 背景 扣除 


零 组 分 区 在 二 维 色谱 数据 中 十 分 重要 ， 可 是 ， 
提出 来 讨论 。 零 组 分 区 的 重要 意义 可 表现 在 以 下 两 方面 : 第 一 如 果 
直接 提供 就 在 这 一 次 量 测 中 的 仪器 噪声 情况 这 
仪器 量 测 噪 声 对 用 主 成 分 分 析 中 的 主 成 分 的 正确 确定 将 带 来 很 大 方 使 ， 这 一 点 


们 认为 有 必要 在 这 里 特别 
在 二 维 色 谱 数 据 不 存在 背景 ， 则 零 组 分 区 可 
样 直 接 提 供 的 


在 本 章 第 一 节 已 说 明 。 另外 ,即便 是 同一 种 仪器 ， 
一 噪声 水 平 也 是 不 严格 的 。 


以 如 果 我 们 对 同一 仪器 总 是 假设 它们 具有 同 


iO EG B NEN. TEL. R 


不 同 的 运行 情况 ,噪声 的 特性 亦 有 不 同 , 所 
从 这 一 角度 来 看 ,二 


维 色谱 数据 中 零 组 分 区 提供 的 同一 次 量 测 中 的 仪器 噪声 情况 就 具有 特殊 意义 了 。 怎 样 有 效 地 
利用 零 组 分 区 的 噪声 信息 来 决定 体系 的 噪声 水 平 , 在 文献 [168] 中 作出 了 较 详细 的 讨论 , 在 此 
不 再 缆 述 。 第 二 ， 如 果 在 二 维 色谱 数据 存在 背景 ， 零 组 分 区 则 可 直接 提供 就 在 这 一 次 量 测 中 
的 仪器 所 产生 的 背景 情况 ， 就 利用 这 一 信息 可 以 对 二 维 色谱 数 据 的 党 景 进行 扣除 。 在 此 有 必 


要 指出 的 是 ， 


背景 的 存在 将 对 主 成 分 分 析 带 来 很 大 的 影响 ， 它 不 但 影响 体系 组 分 数 的 正确 确 
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E (如 果 是 具有 色谱 漂移 的 背景 一 般 可 将 体系 的 铁 增 加 2， 有 关 详 细 讨论 可 参阅 文献 L169])， 
TE, 它 的 存在 对 二 维 色谱 数据 的 分 辨 亦 影响 很 大 。 所以, 在 对 二 维 色谱 数据 进行 解析 之 前 ， 
如 没有 对 存在 的 背景 进行 扣除 ， 必 将 得 到 很 差 蓉 至 是 错误 的 结果 。 根据 零 组 分 区 信息 提出 了 
一 种 二 维 色谱 数据 的 背景 扣除 方法 %"”， 以 下 对 该 法 作出 简要 介绍 。 

该 法 的 基本 点 就 是 充分 地 利用 有 零 组 分 区 的 信息 ， 实 内 在 零 组 分 区 中 先 化 学 物质 存在 ， 所 
以 , 如 果 在 零 组 分 区 存在 某 种 上 共有 规律 性 的 信号 , 就 实质 上 应 该 是 反映 了 仪器 的 背景 情况 ,该 
法 的 基本 思路 是 比较 一 个 色谱 峰 艇 的 流出 前 和 流出 后 的 语 部 主 成 分 分 析 所 得 的 载荷 矢量 “有 
时 亦 称 拙 象 共 谱 )， 计 算 它 们 的 相合 系数 ， 即 此 两 个 矢量 的 点 积 ， 如果 它 们 的 相合 系数 等 于 I 
或 十 分 接近 于 1 的 话 , 就 说 明 在 此 色谱 峰 附近 存在 同一 的 仪器 背景 , 应 该 县 能 被 有 效 的 扣除 


此 思路 可 电 图 6-46 示意 表 出 。 
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图 6-46 借 特征 结构 跟踪 分 板 技术 所 得 的 两 个 3 组 分 分 析 体 系 在 色谱 保留 时 间 轴 上 的 秩 图 
CO UAB OREM, ALOR 2, O) 3 组 分 重 蕉 色谱 妖 局 部 牧 最 尚 为 3 
设 所 得 到 的 二 维 色谱 数据 为 了 ,如果 还 考虑 到 仪器 的 背景 , 似 可 以 把 此 矩阵 分 成 两 部 分 ， 
即 
于 一 下 十 到 十 至 (6-316) 
Xp. X 表示 二 维 色谱 数据 的 主要 信息 ， 它 们 来 自体 系 存在 的 化 学 物质 ,至 为 随机 误差 ,而 
X, 则 表示 来 自 仪 器 的 背景 ， 因 在 考虑 光谱 背景 的 同时 还 需 考虑 色谱 方向 的 漂移 ， 所 以 它 可 由 
以 下 式 表 出 ， 
X nus (6-317) 
在 此 我 们 将 仪器 的 色谱 漂移 和 光谱 背景 分 别 用 上 和 s 来 表示 , APO M1 HARK EH 
1 的 矢量 ,其 维 数 让 二 维 色谱 数据 的 列 数 和 行 数 来 决定 。 从 式 (6-317) 可 以 看 出 ，%, 为 一 秩 
a 
为 讨论 方便 ， 将 在 以 下 的 叙述 中 将 随机 误差 忽略 ， 于 是 有 
X=X +r as (6-318) 


即 
X,=X.., thts, (6-319) 
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" 如 果 通 过 用 特征 投影 图 检 出 了 在 原始 数据 中 
存在 背景 信息 ， 彰 景 扣 除 就 可 以 根据 以 下 步 
Wo (BLE 6-47)。 

D 采用 局 部 主 成 分 分 析 方 法 对 色谱 峰 
流出 前 和 流出 后 的 零 组 分 区 部 分 进行 主 成 分 
分 析 ， 分 别 取出 两 个 部 分 的 第 一 个 载 街 矢量 
进行 相合 比较 ， 印 


pL ppl (6-320) 
RP, 和 只 分 别 表 沙 色谱 蜂 流 出 前 和 流出 
pipi 1.09 IUE CREIRE, 如果 它们 的 柑 合 系数 
接近 于 1, 这 说 明 已 找 全 了 背景 光谱 , 也 就 是 

+ 说 找到 了 式 (6-318) PH S. 


D 采用 上 述 主 成 分 分 析 所 得 的 两 个 部 

一 一 一 一 一 分 的 第 “个 得 分 矢量 ,或 一 有 代表 性 的 波长 

d 保 图 对 间 s B OA EER ШЕРИ i h 10 
以 得 到 式 (6 318) ite, 

D 用 如 此 得 到 的 "和 上 来 进行 背景 扣 


图 6-47 背景 漂移 扣除 示意 图 


除 ， 即 
X.=X— (t1'+ 1s) 

FIR CRB ЛК ЕШ RR ЯК, 所 以 , 对 于 一 个 较 复杂 的 二 维 色谱 数据 、 
需要 采用 分 段 扣除 的 办 法 , 这 一 情况 可 由 图 6-48 表 出 。 采 用 此 法 对 几 个 不 同 的 二 维 色谱 体系 
进行 了 背景 漂移 的 扣除 ， 尼 得 到 较 好 结果 , 其 中 最 有 代表 性 的 是 对 叶绿素 a 降解 体系 的 解析 
读者 可 参阅 文献 [168] 的 图 9 和 图 10. 在 背景 扣除 的 方法 中 , 经 常 有 人 提 到 双 中 心 化 方法 . 在 
文献 [168] 中 对 双 中 心 化 方法 也 进行 了 较 详 细 的 讨论 ,发 现 该 法 的 确 可 以 消除 二 维 色谱 数据 的 
背景 的 影响 . 但 是 , 它 却 引起 .各 局 部 区 域 的 
秩 发 生变 化 ， 尽 管 它 可 保持 整个 矩阵 的 秩 不 发 
生 蛮 化。 此外， 它 还 将 破坏 二 维 色 谱 数据 的 非 
负 性 ,使 经 双 中 心 化 校正 后 的 年 阵 出 现 负 元 素 ， 
而 不 利于 下 一 步 的 分 辨 解析 。 

此 法 只 讨论 了 色谱 方向 漂移 为 直线 的 情 
况 , 因此 ， 可 以 说 只 能 适用 于 一 些 漂移 不 严重 
的 二 维 色谱 数据 的 背景 扣除 ， 对 于 某 些 色谱 漂 
移 很 严重 的 体系 ,色谱 方向 漂移 可 能 不 是 直线 ， 
而 且 ， 光 谱 背 景 也 可 能 因为 色谱 的 梯度 洗 脱 等 
原因 而 发 生 改 变 ， 对 于 这 样 的 体系 ， 如 何 进行 图 6.48 SLAC RARER 
有 效 的 背景 扣除 仍 为 一 值得 研究 的 重要 课题 。 
希望 能 引起 广大 同行 的 关注 。 

1. 选择 性 信息 与 满 秩 分 辨 

正如 前 曾 所 讨论 的 ， 选 择 性 信息 对 于 二 维 色谱 数据 具有 重要 意义 它 可 使 - 些 常 见 的 重 
和 模式 得 到 唯一 解 ， 这 就 是 以 下 将 要 讨论 的 满 秩 分 辨 力 法 。 
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从 前 面 的 讨论 可 知 , 借 特 征 结构 跟踪 分 析 CET AO 和 特征 投影 图 可 以 找到 选择 性 信息 , HT 
单 组 分 的 纯 组 分 光谱 或 色谱 区 域 ， 这 些 选择 性 信息 找 出 对 二 维 色 谱 数 据 的 分 辨 将 带 来 很 有 用 
的 信息 。 在 讨论 日 标 转换 迭代 因子 分 析 法 《ITTFA》 时 曾 指 出 ， 如 果 找 到 了 一 个 满 秩 旋转 从 
阵 妨 ,也 就 可 将 主 成 分 分 析 所 得 到 的 抽象 光谱 和 抽象 色谱 转 痪 成 为 体系 的 纯 光 谱 和 纯色 谱 ,所 
以 ， 很 多 二 维 色 谱 数据 的 分 辩 方 法 的 日 的 也 就 在 于 找到 这 个 转换 矩阵 R. PE, 
HELP 方法 的 满 秩 分 辨 是 怎样 利用 选择 忻 信息 来 唯一 求 得 这 -一 转换 移 阵 及 的 ， 对 子 各 组 分 浓 
度 分 布 和 失 量 的 情况 ， 有 


6—Tr, (6-321) 

从 式 6-321) 可 以 看 出 ， AT ЖЫН ERD RH, MRE Mie 6-1. ns 
n) 的 某 些 已 知 信息 , BEAT AA I EA ЖКА r RIE r 以 后 , 再 利用 此 式 算出 整个 < Ж. 
问题 的 关键 是 怎样 来 利用 所 谓 的 “ 某 些 已 知 信息 "? 

从 前 面 的 讨论 可 知 ， 利 用 演进 特征 投影 图 和 特征 结构 跟踪 分 析 方法 ， 可 以 得 到 某 些 组 分 
的 选择 性 信息 和 秩 图 , 对 于 图 6-40 所 示 出 的 三 组 分 体系 . 可 以 很 容易 地 找到 第 一 流出 组 分 和 
第 三 流出 组 分 的 选择 性 区 域 和 它 人 | 的 零 浓 度 区 域 (参见 图 6-49 的 阴影 部 分 ), 现 以 第 一 流出 组 
分 为 例 来 说 明 HELP 方法 的 满 秩 分 辩 过 程 . 首先 找到 它 的 选择 性 区 域 , EA co 然后 找到 它 
的 零 浓度 区 域 , 记 为 eo。 因为 在 第 一 流出 组 分 的 选择 性 区 域 里 , RAC MADE. 所 以 ， 
此 时 的 色谱 就 是 该 组 分 的 纯色 谱 浓度 分 布 ， 此 外 . 在 该 组 分 的 零 浓 度 区 域 中 ， 很 明显 ，c., 的 
每 一 个 元 素 都 等 于 零 ， 把 这 两 部 分 合 起 来 SRA 6-49 的 下 面部 分 )， 并 把 它 记 为 e-……， 这 
样 就 找到 了 第 一 流出 组 分 的 “ 某 些 已 知 信息 ”。 于 是 可 把 式 (6-321) 改写 成 

Com 1 Tian (6-322) 


Te Mes 
— 
nis (Toa Freon)? Faso a * (1,3) 


6-49 WRN E n BA 


在 此 ,7,+, 表 示 得 分 和 矩阵 了 中 的 与 第 一 流出 组 分 的 选择 性 区 域 和 零 浓度 区 域 的 相对 应 部 分 ( 参 
见 图 6-49), 注意 到 选择 件 区 域 包含 了 第 一 流出 组 分 的 信息 , 而 等 浓度 区 域 又 包含 了 其 余 两 个 
组 分 的 信息 , 所 以 , 这 样 得 到 的 T,…, 昌 说 只 是 了 矩阵 的 一 个 子 甜 阵 , 但 它 实际 上 已 包含 了 3 个 
组 分 的 信息 ， 为 一 满 秩 矩阵 ， 故 可 求 得 唯一 解 。 当 然 、 由 于 只 为 了 矩阵 一 部 分 ， 它 就 不 能 保 
持 了 抵 阵 的 正 交 性 了 。 因 为 To, 为 一 满 秩 矩阵 ， 而 co.…1 又 是 已 知 的 ,这 样 就 可 以 很 容易 地 利 
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用 最 小 二 乘 方法 来 对 式 (6-322) 求解 了 ， 即 
nc, TOT, iu (6-323) 
求 得 后, 再 利用 式 — Tr. 即 可 求 得 整个 c: Ж, XT с, 可 采用 同样 的 方法 ， 先 找到 它 的 先 
择 性 区 域 和 零 浓度 区 域 以 得 到 相应 的 矩阵 子 矩 阵 ， 同 样 采用 eim Tr. 式 即 可 求 得 c ж. 
Rio 和 cs 后 ,在 选择 性 区 域 中 可 得 到 st 和 s;， 利 用 下 式 即 可 得 到 组 分 2 的 二 维 色谱 
矩阵 ， 
X,=X— (сву oo ess) (6-324) 
Fl X. Ер, 为 一 双 线 性 矩阵 ,对 其 直接 分 解 即 可 求 得 它 的 纯 组 分 光谱 
和 色谱 米 。 企 此 值得 提出 的 是 ,上述 满 秩 分 解 算法 是 可 以 推广 到 多 于 二 组 分 的 混合 体系 的 .我 
们 将 此 推广 称 为 组 分 剥离 过 程 ， 这 一 过 程 可 由 图 6-50 形象 表示 出 , 有 关 详 细 的 讨论 可 参阅 文 
献 [170]。 
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图 6-50 ASM BE SER ЖЧ 
BGA DPE А РНС EP 1A AI STR SR. ORE TBI AR 
光谱 及 纯色 谱 图 ， 然 后 消除 它们 的 影响 ， 使 该 体系 成 为 一 个 3 组 分 体系 ， 
继续 使 用 此 法 ， 可 将 此 5 组 分 体系 全 部 分 辩 


【基本 解析 步骤】 


综 上 所 述 ， 整 个 HELP 算法 将 有 以 下 几 个 步骤 来 完成 : 
CD 背景 的 检测 和 扣除 。 利 用 演进 特征 投影 图 对 要 分 辨 的 数据 进行 分 析 ， 如 果 零 组 分 区 的 
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HERE AAR SG, е СА, ЧЕР Е ОСЕ ole m RR 

O 数据 预 处 理 与 体系 组 分 数 的 确定 。 对 于 存在 有 不 等 性 方差 噪声 的 数据 ,在 用 特征 结构 
跟踪 分 析 (ЕТА) 来 确定 体系 的 匆 图 之 前 ， 有 必要 进行 项 处 理 。 另 外 ， 在 决定 体 条 的 组 分 数 
时 ,同样 有 必要 利用 演进 特征 投影 图 , 实 因此 图 对 各 组 分 的 依次 流出 将 给 出 很 重要 的 信息 , 以 
帮助 证 实体 么 的 组 分 数 。 

O 选择 性 信息 和 零 浓 度 区 的 确定 , 问 时 利用 演进 特征 投影 图 和 特征 结构 跟踪 分 析 所 得 的 
秩 图 来 确定 选择 性 区 域 以 及 该 组 分 的 零 浓 度 区 域 。 

D 纯 组 分 光谱 和 色谱 的 满 秩 分 辨 , 利用 满 秩 分 辨 技术 对 已 知 选 择 性 信息 和 零 浓度 区 域 的 
组 分 进行 分 辨 ， 求 得 其 转换 矢量 以 获得 该 组 分 的 纯 光 谱 和 纯色 谱 。 对 于 组 分 数 大 于 3 的 多 组 
分 体系 ， 可 采用 组 分 剥离 技术 来 逐步 进行 。 

© 对 分 辨 所 得 结果 进行 证 实 。 将 分 辩 所 得 的 各 纯 光 谱 与 纯色 谱 乘积 的 线性 加 合 结果 与 实 
际 数据 进行 比较 ， 以 进一步 确证 所 得 结果 的 可 靠 性 。 

【讨论 】 

从 以 上 所 讨论 的 这 五 步 可 以 看 出 , 直观 推导 式 演进 特征 投影 法 (HELP) 是 以 你 步 推 导 的 
方式 , 层 层 深 入 地 来 解析 二 维 色 谱 数 据 , 从 背景 的 检 出 和 扣除 、 椒 等 性 方差 噪声 的 预 处 理 、 选 
择 性 信息 的 确定 、 秩 图 和 色谱 流出 模式 的 确定 一 直到 最 后 的 满 秩 分 辨 ， 每 一 步 都 是 从 直观 的 
特征 投影 图 ， 局 部 因子 分 析 和 特征 结构 跟踪 分 析 的 所 得 的 形象 结果 来 进行 的 ， 这 也 是 我 们 将 
此 法 称 之 为 直观 推导 式 方法 的 原因 。 

在 此 讨论 的 渐进 因子 分 析 法 “EFA)、 轿 定 尺寸 移动 窗口 渐进 因子 分 析 法 (FSMWEFA) 
以 及 本 节 讨 论 的 直观 推导 式 演进 特征 投影 法 (HELP) 与 在 前 一 节 中 讨论 的 用 主 成 分 分 析 法 真 
接 对 整个 矩阵 进行 体系 组 分 数 确定 的 方法 (在 本 书 中 直接 称 之 为 “全 局 主 成 分 分 析 法 ”) 的 最 
大 不 同 之 点 就 在 于 它们 是 着 眼 于 局 部 的 信息 。 由 于 色谱 具有 分 离 特性 ， 所 以 ， 对 于 具有 一 定 
特性 的 联 用 色谱 的 二 维 数据 ， 一 般 说 来 ， 这 些 渐 进 的 、 窗 口 的 分 析 方法 要 明显 优 于 那些 一 次 
性 的 、 全 局 的 分 析 方 法 ， 而 使 得 一 些 具有 特定 的 二 维 色 谱 数 据 可 以 得 到 唯一 解 ， 为 黑色 分 析 
体系 的 精确 解析 提供 了 可 能 性 。 这 是 因为 这 些 渐进 的 、 窗 口 的 分 析 方法 很 充分 地 利用 了 色谱 
的 分 离 特 性 ， 将 一 个 较 复杂 的 多 组 分 体系 首先 化 解 成 若干 个 柑 对 简单 的 子 体系 ， 而 将 一 些 影 
响 分 辩 结 果 的 重要 因素 ， 如 光谱 和 色谱 重 侮 性、 组 分 之 问 的 相对 浓度 比 、 噪 声 水 平 的 确定 等 
降低 到 尽 可 能 的 低 水 平 。 当 然 ， 对 于 一 般 的 黑色 分 析 体 系 的 唯一 精确 解 仍 是 化 学 计量 学 研究 
的 一 个 热点 问题 ， 这 在 以 后 的 讨论 中 将 逐步 展开 。 

由 于 直观 推导 式 渐 进 特征 投影 法 (HELP) 具有 从 原始 数据 的 背景 扣除 一 直到 色谱 重 
登 峰 的 最 后 分 辩 的 所 有 解析 步骤 ， 所 以 近年 来 得 到 了 广泛 地 应 用 ， 它 被 应 用 于 药物 纯度 
的 直接 检验 、 光 化 学 研究 中 的 叶绿素 a 的 降解 分 析 570、 红 外 光谱 分 辩解 析 -02、 复 杂 的 环 
境 分 析 中 空气 实际 样本 的 多 环 芳烃 的 定性 定量 分 析 " 当 等， 取得 了 令 人 兴奋 的 成 果 , 是 一 
个 值得 重视 的 研究 新 领域 ， 以 下 我 们 将 以 环境 分 析 中 空气 实际 样本 的 多 环 芳烃 的 定性 定 
量 分 析 为 例 来 对 HELP 方法 解析 的 全 过 程 给 出 较 详 细 的 说 明 ， 以 求 谈 者 对 HELP 方法 有 
一 个 整体 印象 。 

多 环 芳烃 是 一 类 广泛 存在 于 人 类 环境 中 的 有 机 污染 物 的 统称 。 在 一 千 多 种 能 使 动物 致癌 
的 物质 中 ， 多 环 芳烃 占 三 分 之 一 多 ,因此 , 对 多 环 芳 燃 的 研究 在 理论 和 实际 上 都 有 重要 意义 。 
我 们 用 HELP 方法 对 香港 城市 大 气 颗粒 物 中 进行 了 多 环 芳 径 化 合 物 的 定性 定量 分 析 ， 分 析 结 
果 说 明 ， 在 该 样本 中 存在 47 种 化 学 成 分 ,其 中 有 18 种 为 多 环 芳烃 化 合 物 及 其 本 生物， 分 辩 
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结果 与 毛细 管 气相 色谱 与 质谱 联 用 仪 所 得 结果 一 敏 。 
图 6-51 分 别 示 出 了 该 空气 样本 在 254nm, 260nm 及 310nm 上 测 得 的 色谱 图 。 从 图 可 以 看 


出 ， 每 个 图 中 都 只 有 不 足 20 个 色谱 峰 。 


用 HPLC-DAD 所 带 的 常规 标准 光谱 库 搜 索 发 更 ， 只 


有 4~5 个 色谱 蜂 位 置 的 光谱 与 标准 光谱 匹配 程度 较 高 ， 这 表明 样本 的 实际 组 成 可 能 很 复杂 ， 


所 得 的 色谱 峰 可 能 大 多 为 未 完全 分 离 的 和 
52， 发 现 此 样本 确实 含有 47 种 化 学 成 分 


ERE, H HELP 方法 对 此 样 术 的 解析 结果 示 于 图 6- 
| KPA TS 种 为 多 环 芳烃 化 合 物 及 其 衍生 物 (参见 


图 6-52 中 由 数字 表 出 的 色谱 峰 )。 下 面 以 保留 时 间 分 别 为 (20. 47~24. 53) min 和 (12. 00— 
16.00) min 的 两 段 峰 艇 为 例 来 说 明 样本 的 解析 全 过 程 [参见 图 6-51 (а) 中 标 出 部 分 ] 。 
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图 6-51 空气 样本 在 波长 为 254nm 


(c) 
(a), 260nm (b), 310nm (с) 的 色谱 流出 曲线 


保留 时 间 /min 


图 552 样本 的 解析 结果 
《图 中 数字 表示 已 确认 的 PAH) 
1—98, 2—98, 3—Ms 4—38; 5—0: 6—0: 7— tk, 8 SRL MEE. 9- Hu 10—496 
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办 实际 样本 的 量 测 一 般 都 存在 基线 漂移 ， 所 以 , 在 进行 分 辨 以 前 , 首先 要 扣除 漂移 背景 。 
对 保留 时 间 (20. 47—24. 53) тіп 所 示 的 峰 往 前 后 的 两 个 零 组 分 区 进行 局 部 主 成 分 分 析 所 得 结 
果 示 于 图 6-53, 所 得 的 两 个 第 一 载荷 矢量 的 相合 系数 为 0. 9945, 星 然 ,体系 存在 背景 漂移 , ЖП 
用 前 述 方法 进行 背景 扣除 。 以 后 对 该 样本 的 其 他 色谱 峰 都 尽 采 用 此 法 来 预先 进行 背景 扣除 而 
后 再 进行 分 辨 的 。 
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Р 6-53 RBA (20.4;—21 53) mn 的 峰 艇 的 背景 扣除 图 
GO M EE 230nm 的 色谱 流出 曲线 (阴影 部 分 表示 寺 组 分 区 ); (b), (c) ЕВО ETT -PCA 
所 得 的 前 两 个 载 共 矢 最 ，+ 为 第 一 个 载荷 矢量 ,为 第 二 个 载荷 矢量 
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图 6-54 Е 50 (20.47~24. 53) min KER BOR ET 
(a) Midi 230 纳米 的 色谱 流出 曲线 〈 图 中 阴影 部 分 表示 选择 性 区 域 ); 
(b) 体系 的 特征 结构 展 踪 分 析 图 《… 为 噪声 水 平 ) 


背景 扣除 后 ， 进 一 步 就 要 确定 峰 簇 中 组 分 数 和 选择 性 信息 。 建 议 采 用 特征 投影 图 和 特征 
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结构 跟踪 分 析 (ЕТА) 两 种 技术 共同 来 确定 峰 答 中 的 组 分 数 和 选择 性 信息 ， 实 因 只 有 当 两 种 
技术 所 得 结果 相 一 致 时 ， 所 得 最 终 分 辨 结果 才 可 靠 . 图 6.54 未 出 了 保留 时 间 (20. 47 一 
24.53) min 区 域 的 峰 徐 特征 结构 跟踪 分 析 所 得 的 秩 图 (ЕТА 图 )。 从 图 6-54 可 以 看 出 ， 此 峰 
BOB 1 个 五 组 分 体系 ， 且 5 个 组 分 都 存在 选择 性 区 域 。 从 各 个 选择 性 区 域 中 可 和 容易 地 获得 各 
组 分 的 纯 物 种 光谱 ， 即 对 各 选择 性 区 域 作 局 部 主 成 分 分 析 ， 继 取 其 第 一 个 载荷 矢量 。 因 为 已 
经 取得 所 有 组 分 的 纯 物 种 光谱 ， 然 后 直接 用 最 小 一 乘 方法 邯 可 得 它们 的 相应 纯 组 分 色谱 。 图 
6- 王 示 出 了 该 峰 艇 的 分 辨 结果 , 经 与 PAH 的 标准 光谱 比较 可 知 , 体系 中 的 组 分 1、3、4、5 分 
HAREA ЖШ. Ж# [а] 莉 及 些 的 衍生 物 ， 解 析 所 得 光谱 与 标准 光谱 吻合 很 好 。 
与 上 例 相 比 , 对 保留 时 间 (12, 00—16. 00)min 区 域 所 包括 的 峰 得 的 定性 分 辨 就 较为 困难 。 
首先 就 是 该 峰 簇 的 组 分 数 难 于 确定 。 表 6-16 和 图 6-56 分 别 作 出 了 对 该 蜂 簇 进行 主 成 分 分 析 
所 得 的 特征 值 和 特征 向 量 的 结果 。 从 表 6-16 看 来 ,似乎 该 体系 为 1 个 4 组 分 体系 , 实 因 从 第 
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图 6-55 (REALE) (20.47—24.53) min MA ER 
(a) 解析 所 得 的 色谱 流出 曲线 ;人 b) — (D RT 1—5 RE 
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Ж 6-16 对 (12.00—16.00) min Т РСА 所 得 的 特征 值 
序号 1 B 3 n 5 б 7 8 9 
特征 值 | 2.17 0. 69 0.40 — 0.23 ооб 0.04 9. 02 0.02 vol 


五 个 特征 值 以 后 变化 就 很 小 了 ; 而 从 特征 向 量 的 结果 (图 6-56) 看 采 ， 似 乎 该 体系 义 是 1 个 
5 组 分 体系 , 实 因 第 六 个 特征 向 量 就 很 像 噪声 的 形状 了 。 可 是 , 实际 上 该 峰 侯 是 1 个 七 组 分 体 
系 ! 图 6-57 给 出 了 它 的 ETA 图 和 特征 投影 图 , 两 个 图 都 指出 该 峰 复 存在 有 五 个 选择 性 区 域 、 
即 图 6-57 (а) ERBI AL В, С, FAGE, 与 其 相对 应 , 图 6-57 (b) 给 出 了 它们 在 特征 投 
影 图 的 直线 段 [RPR HK a, 5, с, d 对 应 于 图 6-57 (a) PRF, é 对 应 于 图 6-57 (a) 中 
的 Gj, 而且 这 些 直 线段 经 延长 都 通过 原点。 注意 到 图 6-57 (a) 中 的 号 入 所 指示 的 岗 组 分 
HR, 说 明 该 峰 簇 至 少 为 -7 组 分 体系 ， 同 时 . 从 图 6-57 (00 给 出 的 演进 特征 投影 图 来 分 
析 , Ac RB а 8, 投影 曲线 改变 方向 两 次 也 证 实 了 这 一 点 . 根据 以 上 结果 . 可 以 初步 确定 该 
峰 簇 至 少 存在 7 个 组 分 , Ж ЕТА 网 得 到 的 各 组 分 选择 性 信息 和 它们 的 零 浓 度 区 域 , 采用 前 述 
的 满 秩 分 兴 技 术 ， 可 先 将 这 5 个 具有 选择 性 信息 的 组 分 分 辨 出 来 ， 然 后 采用 组 分 剥离 技术 将 
它们 在 此 峰 焦 的 贡献 减 去 ， 继 对 剩余 部 分 进行 特征 结构 跟踪 分 析 。 对 剩余 部 分 进行 特征 结构 
跟踪 分 析 的 结果 示 于 图 6-58, AR 6-58 可 以 看 出 ， 所 剩 部 分 确 为 一 2 组 分 体系 。 该 峰 繁 的 总 
的 分 辨 结果 示 于 图 6-59。 在 此 峰 簇 的 7 个 组 分 中 ， 第 二 、 三 组 分 分 别 为 荧 万 和 让 ， 第 六 组 
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图 6-56 对 保留 时 间 为 《12. 00 一 16. 00) min AMER (а) ~ (h) 
进行 全 局 PCA 所 得 前 8 个 特征 向 量 
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R, 我 们 还 做 了 毛细 管 色谱 质谱 联 用 分 析 ， 从 其 总 离子 流 色谱 中 可 得 该 栏 本 有 40 JU E, 对 
PAH 的 定性 分 析 结 果 也 与 用 HELP 方法 解析 所 得 结果 相 一 致 ， 从 而 进一步 说 明了 HELP Jr 
法 的 可 靠 性 。 
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图 6-57 HELP 方法 确定 保留 时 间 为 《12. 00~16. 00) min ОЕ 
(а) 体系 的 ETA A Co AKP): (b) 体系 的 特征 投影 图 


2s — 未 知 复杂 样本 如 生物 样本 、 天 然 药物 、 环 
境 样 本 等 的 分 析 在 生物 化 学 、 药 物化 学 、 环 境 
化 学 等 领域 有 着 极其 重要 的 地 位 ， 对 这 些 样本 
的 直接 快速 的 定性 定量 分 析 可 以 说 是 当前 分 析 
化 学 的 热点 和 难点 ， 从 上 例 看 来 ， 化 学 计量 学 
”近年 来 发 展 的 黑色 分 析 体 系 的 解析 方法 ， 其 中 
特别 是 HELP 方法 为 这 些 末 知 复 杂 样 本 的 直 
接 快速 分 析 提 供 了 一 个 思 新 的 途径 ,是 一 类 极 
有 发 展 前 途 的 分 析 方 法 。 
‘Pe I 14 eS 144 116118 (六 》 正 交 投 影 分 辨 法 
保留 时 间 /min [基本 思路 】 
图 6-58 通过 满 秩 分 辨 消去 图 6-57 中 具有 选择 性 正 交 投影 分 辨 算法 (OPR) 是 基于 Lorber 
区 域 的 5 个 组 分 后 峰 签 剩余 部 分 的 ETA 图 。 ”提出 的 正 交 投 影 “的 基 克 思路 而 提出 ,在 结构 
RA 上 与 Malinowski 提出 的 窗口 因子 分 析 法 
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CWFA) ЖД, 它 也 是 利用 已 知 的 体系 中 含 "一 1 个 物种 的 窗口 米 对 第 = 个 物种 进行 正 交 投影 
以 求 得 其 色谱 流出 信息 。 最 简单 的 例子 是 在 小 色谱 峰 完 全 定 大 色谱 峰 覆 盖 的 情况 中 ， 利 用 已 
经 知道 的 大 色谱 峰 相 对 应 的 纯 物 种 光谱 来 求 得 小 色谱 峰 的 形状 上 。 实际 上 , 这 一 算法 可 容易 
地 拓 广 至 一 般 色 谱 重 登 情况 的 分 辨 ,对 于 最 常见 的 三 组 分 体系 分 辨 的 基本 思路 图 示 于 图 6- 
60， 在 以 后 我 们 还 可 以 看 到 ， 正 交 投 影 技 术 还 可 用 于 来 诊断 不 同 的 色谱 重 登 模式 ， 从 这 一 角 
度 来 说 ， 它 明显 优 于 EFAC 90。 下 面 我 们 将 对 正 交 投影 分 辩 算 法 给 出 介绍 。 
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= 50] А 
12 125 ^3 188 14 148 15 185 16 
保留 时 间 /min 
(a) 
0.5 
0.2] 
< 
` A | 
0 D ` 
250 300 350 400 290 300 350 400 
波长 /nm 波长 /nm 
(b) с) 
0.5] 0,4 
* AAA U 
07—50 300 350 300 O 250 300 350 400 
波长 /nm 波长 /nm 
(d) (e) 
0.4 0.5 
人 O < 
0-1% 300 350 400 O 280 300 350 400 
波长 /pm 波长 /nm 
(D (z) 
0.4 
<, 2 / \ 
9 


250 "500 356 400 
波长 /nm 
(h) 
图 6-59 保留 时 间 为 〈12. 00~16. 00) min А ЁТ Ж 
а) 色谱 流出 曲线 ;(b) ~ (h) 各 组 分 的 光谱 cet rotes -…- 标 准 光谱 > 


【基本 算法 了 
正 交 投影 分 辨 算法 由 以 下 几 个 步骤 构成 ， 
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T 利用 秩 图 来 定义 体系 中 不 同 的 含 (mn 一 1) 个 物种 的 窗口 (参见 医 6-60), 
@ 对 已 定义 的 (n 一 1) 个 物种 的 窗口 所 对 应 的 子 矩阵 进行 主 成 分 分 解 以 得 到 (0—1) 个 
标准 化 的 且 相 互 正 交 的 载荷 和 欠 量 (或 称 为 抽象 光谱 )、 
@ 构成 出 这 (xn 一 1) 个 载荷 矢量 组 成 的 投影 矩阵 М, 
M= UP," Ор, y (6-325) 
AP, M GT 1.2. s008 X] EE PLS OR HR PE y C (EO RE OY pu, 
Pasto Pocos MRR H Ж] EE ВЛ Ж А ЖН Ga — 1) ТЈ BU Ëf П PR X°] У B T ARE 
进行 主 成 分 分 解 而 得 到 的 (x 一 1) 个 标准 正 交 的 载荷 矢量 :7 为 一 相应 大 小 的 单位 矩阵 。 
D 对 于 不 同 的 组 分 ,用 不 同 的 投影 矩阵 M. CE — 1.2. oo XH А Е АЕ Е Х 的 每 一 条 
光谱 矢量 х 进行 投影 运算 ， 
ху Sr M= (ast testes, Pio PP 
= (es) Mi= Casi ), (6-326) 
式 中 ,下 标 7 表示 混合 物 量 测 和 矩阵 X 的 第 ) 条 光谱 ,关于 (6-55} 式 的 证 明 在 本 节 的 最 后 。 
© 因为 光谱 矢量 x 经 投影 运算 之 后 得 到 的 x” BT RA F c, fü s; 信息 ,所 以 ,如果 对 
式 (6-326) 两 边 同时 进行 取 模 运算 ,立即 可 得 
lx; |= M Gee," (6-327) 
П [| = (e), CG l (y= Letom) (6-328) 
式 中 ,为 光谱 的 波长 点 数 。 上 式 左边 的 | | WER TAAK Соо), | G; WERNER 
的 。 在 此 还 特别 值得 提出 的 是 ,对 于 [| (5; 060, [| PR I G7 ЖП У Кк j, 这 是 因为 
对 于 不 同 的 光谱 矢量 蕊 中 的 & 是 同一 的 , 故 也 是 同一 的 。 
如 果 将 m SCIL | Gm Ls om KREKERI -TRE MEIRE y .…， 
Ix, ‖ ) ,再 根据 式 (6-326) 得 


Oba so Pat ID 
= (C 0 lb m GOs Те 
= | GZ) || GG m Conn) (6-329) 


即 要 求 的 第 b 28 Op Bb Ve BE УЙ Ж Т —1 ЖЖ | (s; 1 ,因为 是 未 知 的 ,所 以 这 个 常数 
| se 六 十 亦 为 未 知 。 因 此 , 式 (6-329) 得 到 的 浓度 分 布 并 不 是 实际 的 第 《组 分 的 浓度 分 布 ,而 
是 它 与 一 未 知 常 数 的 乘积 。 

重复 第 @@ 步 和 第 @ 步 , 求 得 每 个 物种 的 浓度 分 布 模式 , 即 可 用 荫 小 二 乘 技术 算出 纯 物 
种 的 光谱 来 , 即 


S=(C0) CX (6-330) 

ER C SER AR Fe Sc hcl PE ЭЛЙ A OE S 的 求 得 , 实 因 样 求 得 的 8 只 是 
在 大 小 上 与 实际 的 8 不 同 , 只 需 将 它们 进行 标准 化 处 理 就 行 了 。 

以 上 讨论 的 用 正 交 投影 方法 来 进行 黑色 分 析 体 系 解析 的 过 程 基本 与 Malinowski 提出 的 
窗口 因子 分 析 法 类 似 , 整 个 过 程 可 由 图 6-60 形象 地 表示 出 。 

Die] 

式 (6-55) 的 证 明 ( 在 此 只 给 出 等 于 时 的 情况 ,其 余 可 类 推 );: 

ХП PMH TE Ж.А” Р! 是 它 的 广义 逆 , 根 据 广义 逆 的 性 质 ( 参 
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见 第 十 一 章 ), 有 
DE (6-331) 
e[1]2[.3 | 2 [a3 fel 
图 6-60 ERREA HE AE BERE М ЛЕВЕНТЕ 
SCR PPE AR URGE E CET AO GRP BRL 个 二 组 分 区 
ЖЕНА SE k USSR (LIE TE AM АГЕ 
(a) 以 第 一 .二 组 分 信息 构成 正 交 投影 阵 , 求 得 第 三 组 分 之 纯色 靖 ! 
分 构 戌 投影 阵 求 第 一 组 分 的 纯色 谱 ; 
(с) 以 第 一 .三 组 分 构成 投影 阵 , 求 第 一 组 分 的 纯色 谱 
如 果 写 成 矢量 形式 , 则 有 
a e Dn Dag in (8-332) 


式 中 .x"” POR BRE X^ BIS GL 
据 此 可 以 构造 一 个 正 交 投 影 矩 阵 
M=(1—X% UT X979) ‹6-333) 
式 (6-333) 所 示 的 正 交 投影 矩阵 实际 上 就 是 前 述 所 示 的 正 交 投影 矩阵 . 对 矩阵 xo U TT UR 
分 分 解 ,可 得 
XV SY PGE pe b: (6-334) 
TE U AI EXER, BU TI XB О — XE f E BE, kE Т X 矩阵 的 非 噪声 特征 值 ， 
如 与 本 章 的 第 一 节 所 说 的 特征 值 对 应 的 话 , 是 了 矩阵 的 协 方差 阵 所 得 特征 值 的 平方 根 ; 严 为 
一 行 正 交 第 阵 , 即 所 谓 载荷 护 阵 ,对 式 (6-334) 求 广义 逆 , 则 可 得 
(XP) SY GORD pr) 


一 (Po GE PTY (6-335) 
亦 即 
CORNERO b= peut Gens Debe pec 
一 Po po (6-336) 
x” РУ щн a 1) GR EE SGT 1,2 s- DIA TER GO. BD 
af (soe deme as 1; (6-337) 


而 对 于 一 个 含 个 物种 的 量 测 和 矩阵 XX, 它 的 每 -- 行 x: Н] n PER DURO 1,2.) 
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的 线性 组 合 , 即 
x; = Ces bet becas ca des 


= UU os (6-338) 
所 以 , 式 C6-326) 可 表示 为 
х7 Sx M= Cosy eas, idees UR poco pec) 
=G" Бов, АР" npe m 
mat por D POUL (ous qu PO pec») 
ma P gp Pon np yon (ous (T poco pem) 
Sx, mg OPE (us io po opem 
= (сМ — Gast 
TEMERE ЕКИ e SUN n 就 变 成 (6-326) 式 。 
实际 上 我 们 还 可 以 证 明 本 节 介 绍 正 交 投影 分 辨 法 坊 Malinowski 提出 的 窗 凯 因 于 分 析 法 
是 同一 的 ,参阅 文献 [177]。 
Go 子 窗口 因 于 分 析 法 
【基本 思路 】 
前 述 分 辨 方法， 如 渐 近 因 了 于 分 析 法 、 窗 口 因子 分 析 法 及 正 交 投影 分 办 法 ， 都 是 以 分 辨 纯 
组 分 色 溢 为 其 目标 ， 而 在 本 节 介 绍 的 子 窗 口 因 于 分 析 法 却 是 以 分 辨 纯 组 分 光谱 为 其 目标 。 该 
法 由 Mame 等 提出 "5 ， 其 主要 思路 是 利用 在 色谱 
方向 上 不 同 子 窗口 所 会 有 一 个 且 只 含有 一 个 相同 
纯 物 质 光谱 的 特性 ， 从 而 将 该 纯 物 质 光谱 分 辨 出 
来 . 这 样 的 子 窗口 可 由 图 6-61 简要 示 出 。 
【基本 算法 】 
于 窗口 因子 分 析 算 法 可 由 以 下 几 个 步骤 构成 ， 
L ! | R D 利 由 秩 图 来 定义 体系 吕 不 同 的 含有 一 个 且 
只 含有 一 个 相同 纯 物 质 的 两 个 不 同 子 窗口 《参见 图 
图 6-61 色谱 方向 的 子 窗口 示意 图 6-61). 


共同 组 分 为 中 间 的 流出 的 组 分 ， @ 对 已 定义 的 琴 个 子 窗口 所 对 应 的 子 矩 阵 分 
工 一 中 间 组 分 的 左 窗 口 别 进 行 主 成 分 分 解 ， 以 得 到 两 组 标准 正 交 基 E= 
R 中 间 组 分 的 右 窗口 leiser Om) BL D= (dy dz ,а„}, FE m Al x SP 


HERMA РН H EDS FERRADA. BAAS РЬ АЕ ЭЕ ЭУ 5, В прак 
两 组 正 交 基 同 时 线性 表示 , 则 有 


s= See = Sad, 
= E 


=Ea= DB 
BORG 1.2, m), B G= 2,00) ‚УЮ HREM BB. ME OR 
о=Еѕ B=D's 


图 ЕЯ N, H EE=1,;DD=1,.4 
N= | Ес рр | è =a'E'Ex+ B'D'DB— 20° E' DB 
=2— 2a E'DB 
=2—2f, 
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AHS == Et pp. 

CD 对 上 述 目标 后 数 求 极 小 ,实际 上 相当 于 对 fimo E DB ЖЕК. DEUS 

а= E's= E' DB= E' DD's— E'DD' Ea 
В D's= D' Ea = D'EE's= D'EE'DB 
所 以 ,oa.B 分 别 为 EDD'E M DEED 的 特征 值 为 1 的 特征 向 量 (参见 第 十 一 章 )。 同 时 
g=Ea= DB 

ЖЖЖ а R B, 就 可 算出 该 同时 含 于 两 个 子 抢 阵 的 纯 光 谱 来 。 

® 只 要 没有 含 大 峰 包 小 峰 的 情况 .就 可 为 任 -组 分 找到 相应 的 两 个 子 窗口 ,而 依次 得 到 
Де s Gm 1,2,m A ,在 此 和 4 为 体系 组 分 数 。 求 得 所 有 的 纯 组 分 的 光谱 即 用 式 (6-339) 可 
求 得 各 组 分 的 纯色 谱 来 

C—XSG'S) 7: (6-339) 

【讨论 1 

因 本 法 与 前 述 分 辨 方法 不 同 的 地 方 在 于 它 不 是 求 纯 组 分 的 色谱 而 以 求 组 分 物质 的 纯 光 谱 
为 目标 ， 所 以 ， 可 为 联 用 色谱 的 二 维 数 据 的 解析 带 来 新 内 容 ， 将 此 法 与 前 述 的 正 交 投 影 分 辩 
法 结合 起 来 ， 就 可 直接 同时 求 得 任意 感 兴趣 组 分 的 纯 光谱 和 纯色 谱 ， 从 而 可 对 该 组 分 直接 进 
行 定性 定量 分 析 ， 而 不 必 对 所 有 组 分 进行 全 部 分 辨 。 这 样 的 情况 对 那些 含有 大 峰 包 小 峰 的 分 
析 体 系 特别 有 用 ， 实 因 对 那些 含有 大 峰 包 小 峰 的 分 析 体 系 目前 还 很 难 精确 求解 参见 下 一 
节 ) ， 致 使 不 可 能 求 得 所 有 纯 组 分 色谱 。 有 关 这 样 的 具体 例子 参阅 文献 [179]。 另 外 ， 由 于 该 
同时 含 于 两 个 于 矩阵 的 纯 光谱 * 可 以 遗 过 两 种 途径 Go Be 或 *= В) 而 求 得 , 这 样 我 们 可 以 
对 这 两 个 所 得 结果 进行 比较 ， 如 这 两 个 结果 完全 一 样 ， 说 明 所 得 结果 可 靠 ， 反 之 ， 如 所 得 结 
果 相 差 大 ， 则 说 明 结果 的 可 靠 性 不 高 ， 从 而 提供 了 一 个 检验 分 辩 结 果 可 靠 性 的 工具 。 

OO 二 维 色谱 前 一 阶 徽 分 矩阵 显 序 秩 分 析 方法 

【基本 思路 1 

在 色谱 数据 中 , 经 常 出 现 小 色谱 峰 完 全 被 大 色谱 峰 覆 盖 的 情况 , 由 于 缺乏 必要 的 信息 , 一 
般 说 来 , 是 不 能 求 得 唯一 解 的 , 除非 可 以 找到 另 
外 一 些 特殊 条 件 .对 于 一 般 二 维 色 山 数据 分 辨 中 
求 得 唯一 解 的 必要 条 件 ，Manne 给 出 了 较 详细 保留 时 间 
的 讨论 ,参阅 文献 [180], 本 节 所 将 要 讨论 的 二 维 e 
色谱 的 一 阶 微分 矩阵 顺序 秩 分 析 方法 ,关键 就 在 
于 它 利 用 了 色谱 峰 局 部 对 称 的 约束 条 件 , 引 人 微 
分 色谱 , 才 使 得 小 色谱 峰 完全 被 大 色谱 峰 覆 盖 的 ML 
情况 有 可 能 得 到 唯一 解 ,对 于 色谱 峰 局 部 不 对 称 
的 体系 此 法 是 有 一 定 困难 的 。 

对 于 小 色谱 峰 完 全 被 大 色谱 峰 覆 阑 的 二 维 ЖЕНЕ 
色谱 数据 .其 情况 大 致 不 外 由 图 6-62 所 示 的 三 (e 
种 情况 , 在 此 三 种 情况 中 , 本 节 所 讨论 的 算法 只 
适用 第 二 种 情况 (b)， 即 小 峰 的 报 大 点 与 大 峰 的 ”图 6-62 大 色谱 峰 包 小 色谱 峰 的 三 种 不 同 模式 
极 大 点 不 重合 ， 而 且 在 大 峰 的 极 大 点 处 ， 小 峰 还 未 完全 消失 。 在 此 三 种 情况 中 ， 第 一 种 情况 
(a) 因 大 小 峰 的 极 大 点 完全 重合 , 故 本 法 不 适用 ; 而 对 于 第 三 种 情况 Co), UAE KER 
点 处 ， 小 峰 已 完全 消失 ， 本 法 亦 不 适用 ， 当 然 ， 当 在 大 峰 的 极 大 点 处 小 峰 还 未 岂 现 的 情况 与 
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第 三 种 情况 类 似 ， 亦 不 可 采用 此 法 。 本 法 的 基本 思路 就 是 要 利用 色 潜 蜂 有 且 只 有 一 个 极 大 点 
和 在 对 极 大 点 进行 微分 时 其 值 为 零 的 特点 。 

对 于 一 大 色谱 峰 包 小 色谱 峰 的 二 维 色谱 数据 抵 阵 X, HDE Lambert Зее 定律 ， 可 写成 如 
FER: 
X=as tos, +k 
RP lo i M ZHRS im 1,2: 4 BE AK RA OT AGE IRE x 
PE T HE BB Sh AR НЇН CO REI Go M PRÉC ECL E IAEA JU 局部 是 可 写成 如 
下 形式 
хб) —e (зу Ge) te. (1) 52 Go) 76, 
ETERA ER DL G) FA BS Go М BE PES IPL AB ЛУУ ЕЖЕТ ЛЬ, пав 
误差 项 ,两 个 方向 的 微分 式 可 分 别 表 未 为 

dx, Cw) /dt =s, Cw de, (D /dt 4- s; (ve dey (t) /dt (6-340a) 


或 
Ял, нос, ds (ш) аво e: (ds, Ga /dew (6-340b) 
因为 二 维 色谱 数据 矩阵 的 每 一 行 就 是 一 个 光谱 ,而 每 一 列 就 是 一 个 色谱 ,所 以 也 可 以 将 上 
述 微分 式 (6-340) 写 成 矢量 形式 , 即 
dai) /dt —s Go) de, G) /de-Es Goode GO) dt G=1; sn) (63418) 


或 
dx, jw) Гду Dds Ge) /dw 4-с (ds Qi) /di (j=1 m (6-341b) 
ЖЕЙ, (dart uo /de, (i 二 1,…,n)) 表 示 二 维 色 谱 数 据 对 时 间 方 向 的 微分 矩阵 dX/di 的 每 一 行 ， 
M (da, Cw)/dw,《(j 二 1,…,m)} 则 表示 二 维 色 谱 数 据 对 波长 方向 的 微分 证 阵 dX /qu 的 每 一 
列 , 此 外 , 式 (6-341) 中 隐 含 了 一 个 十 分 重要 的 关系 , 即 分 别 在 两 个 纯 组 分 色谱 的 极 大 点 处 ,也 
就 是 说 de CO /di— 0 BR de, CO /dr—0 的 时 候 ,可 以 很 容易 地 分 别 得 到 两 个 物种 的 纯 光谱 , 亦 即 
dr; ww) /dt | ac anv 8: Cade G)/de (6-342a) 


Hq 
dxi sw) /dt à osi — 8: Cu de, GO /di (6-342b) 
同 理 , 在 两 个 纯 组 分 光谱 的 极 大 点 处 也 就 是 说 ds 2) /de= 0 或 ds GO /de—0 的 时 候 , 可 以 
很 容易 地 分 别 得 到 两 个 物种 的 纯色 谱 , 亦 即 
dx, G rw) / dui |а, osa om ei )ds Go) idw (6-343a) 
和 
dx, G ste) / die |а, io amo ei ds} Ga) / dw (6-343b) 
因为 本 法 的 基本 思路 就 是 要 利用 色谱 峰 有 且 只 有 一 个 极 大 点 的 特点 ,所 以 在 以 后 的 讨论 
中 ,我 们 将 只 讨论 对 时 间 方向 的 微分 矩阵 dX /de 的 情况 .而 对 时 间 方向 的 微分 答 阵 dX/dt 的 每 
一 行 仍 是 存在 于 体系 中 的 两 个 光谱 的 线性 组 合 [参见 式 (6-341?], 因 此 ,经 此 微分 以 后 ,此 矩阵 
的 秩 仍 是 等 于 2, 而 且 它 的 线性 关系 仍然 是 保持 不 变 的 ,当然 , 式 中 的 系数 不 再 是 非 负 的 了 , 另 
外 ,根据 式 (6-342), 只 要 找到 了 两 个 纯 组 分 的 极 大 点 ,就 可 以 得 到 两 个 纯 物种 的 光谱 ， 现 在 的 
问题 是 怎样 才能 找到 这 两 点 的 位 置 ,确定 了 这 两 点 的 位 置 ,就 等 于 找到 了 两 个 物种 的 纯 光 谱 ， 
这 就 是 本 法 要 解决 的 关键 问题 。 
对 于 时 间 方向 的 微分 矩阵 dX/dz, 在 某 一 个 纯 物种 的 色谱 极 大 点 处 , 即 ss Gi 1.22 ,我们 
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有 dc()/ 山 =0。 不 失 一 般 性 ,可 以 先 讨 论 ;一 ! 的 情况 ,好 第 -个 色谱 极 大 点 的 情况 ,因为 此 时 
da GO /de=0,Fr y 
dx Cr sw) de [ssa = (de, (1) / dts; Ge = BS Go? (6-344) 
即 可 得 到 ,第 二 组 分 的 纯 光 谱 , 如 果 在 第 -组 分 色谱 极 大 点 的 附近 色谱 峰 是 近似 对 称 的 , 则 我 
们 有 
de GY dtl = o де тааст (6-345) 
利用 式 (6-345) 所 提供 的 条 件 NIRA PEE dX /de 在 第 一 组 分 色谱 极 大 点 的 前 一 点 和 后 … 
点 的 两 个 光谱 相 加 ,可 以 得 到 
dx; ie) /dé а dx Gru /dt guia 
— [sj Cuo da Ce) /ded-s; Goode, 4) /dt | mans. Fisi C de G2 55 Guo des Q2 /di} Laus ia 
= [de G) dt |ы (adde (0) dt laua ds + des GO /de lius ade /de ms 
— [des € /di | us 4с GI dt lin 1л 382 
=s, (6-346) 
在 此 利用 了 式 (6-345) 所 提供 的 在 第 一 组 分 色谱 极 大 点 的 附近 色谱 峰 屁 近似 对 称 的 条 件 。 
如 果 将 由 式 (6-344) 和 式 (6-346) 所 得 的 两 个 光谱 组 成 一 个 子 矩阵 ,， 亦 即 Cas, as]. ШЕ 
子 矩 阵 的 秩 为 1。 "p 
【基本 算法 了 ANN 
根据 以 上 讨论 的 这 些 结果 ,可 以 很 容易 地 构 Er 
造 一 个 算法 来 确定 二 维 微分 色谱 (对 时 间 方 向 m " 
的 ) 中 两 个 纯 组 分 的 色谱 极 大 点 的 位 置 了 。 ЖИ a п MAER 
法 可 由 以 下 几 个 步 又 来 完成 ， ^ 
QD 在 对 于 时 间 方向 的 微分 矩阵 dX/di 中 选 
择 第 一 个 行 矢 量 ， 即 dx; /dz; А 
Q 第 二 个 行 矢量 就 将 该 矢量 的 前 一 个 和 后 = 
58, BI dx_,/dt dx, dr, ANTM: El 
© 将 这 两 个 行 矢量 组 成 一 个 矩阵 ,并 对 它 进 = 
行 主 成 分 分 析 以 得 到 两 个 特征 值 ; L 
D 从 微分 矩阵 AX /de 第 二 个 行 矢 量 开始 ,不 | 


ийи LRONOA, 一 直到 该 微分 矩阵 dX’ E 
de 的 倒数 第 二 个 行 矢量 ， 这 样 ， 就 可 以 得 到 一 系 £ 
列 的 特征 值 ; 


© 将 由 此 得 到 的 一 系列 特征 值 对 保留 时 间 RERA 
方向 作 图 , 在 图 上 找到 的 第 二 个 特征 值 曲线 中 出 "EP 


现 的 两 个 最 小 点 的 位 置 , 也 就 是 两 个 纯 组 分 色谱 方法 原理 示意 图 
的 极 大 点 的 位 置 , 这 两 点 所 代表 的 微分 矩阵 dX/ D MADERA 
全 的 行 矢 量 ， 也 就 是 两 个 物种 的 纯 光 谱 。 асаав н. EAT EH EK 
【讨论 了 值 处 可 得 该 两 个 组 分 的 纯 物 种 光谱 Ca AD з); 
继 用 顺序 秋分 析 方法 对 读 微分 六 阵 进行 分 析 ， 
此 算法 的 构成 基本 思路 和 期 望 所 得 到 的 结 可 得 图 下 部 的 秩 分 析 结 果 ， 图 中 的 两 个 


果 形 象 地 示 于 图 6-62, 如 果 在 纯色 谱 峰 的 隐 近 的 BRE NERA BAER 
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确 是 对 称 的 , 则 此 法 可 以 得 到 很 理想 的 绪 果 如 图 6-64 Bras, BH 6-64 示 出 的 是 -- 个 用 对 称 的 高 
斯 峰 来 模拟 色谱 峰 的 二 组 分 体系 的 结果 。 另外 ,因此 法 只 适用 在 图 6-62 所 未 二 种 情况 的 第 一 


种 ,所 以 , 在 进行 分 辨 之 前 , 似 有 必要 人 先 确 定 我 们 碰 到 的 情况 是 舍 的 确 属 于 图 6-62 所 示 的 第 
二 种 情况 。 封 于 这 三 种 情况 的 判别 ， 可 采用 特征 投影 图 ， 对 于 上 述 的 三 种 不 同人 情况， 它们 的 
特征 投影 图 示 于 图 6-65。 从 图 可 以 看 出 ， 对 于 这 三 种 情况 ， 它 们 的 特征 投影 医 都 不 同 ， 而 且 
各 具 特 色 ， 很 容易 分 别 。 
1 
0.5 
of 
= 0.5) 
a! 
8 ^ 
E 25 АШТА 
coh /N M A À 
E „/ 1 4 1s EN 
$ to 2 d do 3$) 00 
tals 
(a) 
1 — 1 - 
ATN 
0.8 / x 0.8 ⁄ ` 
/ ` / ` 
NZ E ` PLE ГА \ 
o VA N 04 y ` 
0.2, `. оф N 
oi to o oo 1% % 
A/nm Апта 
(b) {с) 


图 6-64 -PAKE GI NIE TU Ж # BJ Mi PF B 2 ERS 
(а) SB ML, BL (a) 二 部 三 个 极 小 点 0, 2, D, RUPEE 2 和 第 3 点 处 的 牧 为 1， 
应 为 相对 应 的 两 个 纯 物 种 光谱 所 在 位 置 .根据 此 是 点 所 得 的 纯 光 谐 与 真实 
SERA RFA (b) 和 (c) 
И: — 为 实际 纯 组 分 光 赠 ， 从 图 中 可 以 看 出 ， 估 计 值 与 实际 值 哆 台 其 好 


然而 ， 在 很 多 情况 下 ， 在 纯色 谱 峰 附 近 的 对 称 这 一 点 前 提 很 难 满足 ， 这 就 使 该 法 的 适用 
性 受到 很 大 艰 制 。 对 此 ， 该 法 是 否 有 相应 的 解决 办 法 呢 ? 这 是 我 们 将 要 继续 讨论 的 一 点 

因为 一 般 的 色谱 峰 都 不 同 程度 的 存在 着 拖 尾 情况 ， 当 拖 尾 情况 存在 时 ， 纯 色谱 峰 附近 的 
对 称 这 一 点 前 提 就 很 难保 证 ， 在 此 ， 用 两 个 对 称 的 高 斯 峰 来 组 成 一 个 色谱 峰 ， 使 模拟 体系 的 
色谱 具有 拖 尾 现 象 。 这样 组 成 的 两 个 大 峰 包 小 峰 的 二 组 分 模拟 体系 示 于 囊 6-17。 对 于 由 这 样 
具有 拖 尾 色谱 体系 用 硕 序 秩 分 析 方 法 所 得 结果 示 于 项 6-66. 从 图 6-66 可 以 看 出 , 得 到 的 不 是 

而 是 3 个 [图 6-66(a)] 或 者 4 个 [图 6-66(b)] 极 小 点 , 而 且 这 些 极 小 点 都 还 没有 达到 
噪声 水 平 ， 这 时 ， 我 们 应 该 用 什么 方法 来 确定 两 个 纯色 谱 峰 的 极 大 点 呢 ? 

对 于 这 样 的 情况 ,可 以 供 助 特征 投影 图 来 帮助 决定 两 个 纯色 谱 峰 的 极 大 点 、 从 本 章 第 一 
节 的 讨论 可 知 ， 如 果 将 一 两 组 分 的 混合 体系 的 光谱 都 标准 化 成 具有 总 和 和 皆 等 于 某 一 常数 ， 它 
们 在 主 成 分 投影 图 的 投影 点 就 为 条 直线 ， 混 合 物 光谱 的 点 都 应 落 在 两 个 纯 物 种 光谱 的 投影 
点 之 间 ， 这 样 就 可 以 利用 这 一 特点 来 决定 两 个 纯色 谱 峰 的 极 大 点 ， 实 内 如 果 在 顺序 秩 分 析 方 
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法 所 得 的 几 个 最 小 点 为 纯 光 谱 ， 它 们 必须 会 将 处 于 直线 的 两 端 ， 反 之 ， 它 们 就 会 落 在 混合 物 
的 光谱 之 中 。 基 于 这 一 推断 ， 可 以 这 样 来 构造 一 个 新 矩阵 ,首先 将 供 助 原始 站 标准 化 成 具有 
总 和 为 一 常量 的 光谱 ， 然 后 将 由 顺序 秩 分 析 方法 所 得 的 几 个 最 小 点 也 同样 标准 化 组 成 一 个 新 
算 阵 ， 继 将 它们 进行 主 成 分 特征 投影 如 果 ， 所 得 的 岂 个 最 小 点 中 有 -- 个 是 处 在 投影 图 的 端 
点 ， 而 其 他 几 个 在 中 间 ， 则 这 一 处 于 端点 的 就 可 能 是 最 靠近 纯 物 种 的 光谱 点 。 对 表 6-17 的 两 
个 模拟 例子 的 计算 结果 示 于 图 6-67 它们 与 实际 纯 物种 光谱 的 比较 示 于 图 6-68. 从 图 可 知 ,这 
样 所 得 的 结果 是 很 靠近 实际 结果 的 。 所 以 ， 采 取 这 样 的 方法 有 可 能 得 到 一 个 很 靠近 实际 的 近 
Щй, 不失为 一 个 补救 策略 , 对 于 该 法 的 更 详细 讨论 可 参阅 文献 [181]， 当然, 继续 研究 如 何 
得 到 在 色谱 峰 附 近 不 对 称 的 分 辩 等 法 仍 是 具有 重 村 意义 的 。 
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图 6-65 三 种 不 同 模式 的 大 色谱 媒 包 小 色谱 峰 的 特征 投影 图 
与 特征 结构 跟踪 图 (ETA 结果 
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图 6-66 由 表 6-17 所 未 的 两 个 不 对 称 大 色谱 峰 包 小 色谱 峰 情况 
的 一 阶 徽 分 矩阵 顺序 秩 分 析 结 果 图 
1，2，3，4 一 极 小 值 点 


312 


0.8 0.8 
4 
0.6 0.6 
3 3 
0.4 ` 0.4 
А 1 R 
E o2 : 0.2) 1 
H 1 
Q: H ol ! 
` 12 
iz H 
-0.2 i -0.2F H 
Q C OH 0? бз Q4 0.5 0 —S1 62 9$ 394 
PO PC, 
fa) (b) 


图 6-67 由 图 所 对 应 之 主 成 分 投影 峡 
(a) 图 对 应 于 图 6-66 fa) EA TARA Ls Cb) BJ3J E 6-66 rh OO BEER ERR 
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(e) 
E 6-68 两 个 模拟 拖 尾 体系 的 纯 光谱 估计 比较 图 
和 … 和 为 估计 值 ; exe 
(a), Cb) У 6-66 GO Н ЖЕН 6-67(a) 图 个 的 2,3 点 相对 应 的 光谱 ; 
(e), (d), (e) 5 6-56 GO FIL ЖЁН 6-67 CD HH PHY 2.3.4 点 相对 应 的 光谱 
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ROT ЖШШЕ ЕИ ЕЖЕ 


| | KANE | КТ 

色谱 峰 一 —— - ` 
峰 位 置 arx LI Kw dox aR 
кежи 30 күп 10 0 77707 DH 
30 6.44 1.9 | Е 7.07 ei 
лей 25 3.54 | 29 3.87 9.1 
25 ' 3.54 l 0.5 | 29 3.87 0.2 

三 、 张 量 分 辨 方法 
正如 前 面 所 讨论 的 ， 对 于 黑色 分 析 体 系 的 解析 ， 要 获得 唯 -- 解 ， 需 要 三 维 ， 即 张 量 类 型 


的 数据 。 此 节 中 将 详细 讨论 这 种 张 量 分 辩 的 两 种 主要 方法 ， 通 过 对 这 两 种 方法 的 讨论 ， 将 可 
以 更 清楚 地 看 到 ,只 有 这 种 基于 张 量 类 型 数据 的 分 辨 方法 才能 在 任何 没有 附加 的 约束 条 件 下 ， 
获得 唯一 解 。 

张 量 分 辨 方法 在 化 学 中 还 将 是 一 类 很 有 前 途 的 方法 , 因 存 众多 的 分 析 化 学 所 用 的 仪器 中 ， 
联 用 仪器 已 成 为 一 般 分 析 化 学 实验 室 中 的 常用 仪器 ， 如 高 效 液 相 色谱 与 二 极 管 阵列 检测 器 联 
Hit CHPLC-DAD). 气相 色谱 与 质谱 联 用 仪 (GC-MS)， 气 相 色 谱 与 红外 光谱 联 用 仪 GC- 
IR), 高 效 液 相 色谱 与 质谱 联 用 仪 (HPLC-MS)， 质 谱 与 质谱 联 用 仪 “MS-MS), 荧光 发 射 光 
谱 与 激发 光谱 仪 (EX-EM) 等 , TA, 这 种 联 用 的 趋势 还 在 不 断 扩 大 ，Hirschfeld 为 此 列 出 了 
一 个 可 能 被 联 用 的 分 析 仪 器 的 一 览 表 De , 据 Hirschfeld 所 列表 来 估计 ,在 这 些 联 用 仪 中 ,大 
A 60% 可 产生 双 线 性 数据 ,可 以 相信 ， 这 种 联 用 趋势 还 将 不 断 扩 大 。 注 意 到 将 几 个 不 同样 本 
所 测 得 的 双 线 性 数据 合 在 一 块 就 成 了 三 线性 的 数据 ， 所 以 ， 本 章 将 要 寺 论 的 张 量 分 辨 方法 将 
会 成 为 很 有 用 的 分 析 方法 。 其 实 ， 现 在 就 已 经 存在 一 些 可 产生 三 维 数据 的 分 析 仪器 ， 如 三 维 
核磁 共振 仪 、 相 分 辨 菊 光 光谱 仪 (Phase-resolved fluorescene spectroscopy，PRFS)， 本 身 就 可 
以 产生 三 维 数据 ， 从 这 一 角度 考虑 ， 本 节 所 要 介绍 的 方法 可 能 很 快 将 成 为 分 析 化 学 的 常用 
方法 。 

在 详细 讨论 张 量 分 辩 方 法 之 前 ， 先 一 般 化 地 讨论 一 下 张 量 分 辩 的 数学 模型 。 以 下 我 们 将 
采用 黑 花 体 来 表示 三 维 张 量 , WA, F, T 等 ， 对 于 一 个 三 线性 的 量 测 张 量 ， 一 般 可 用 式 
(6-347) Ж. 


一 CCz+e (6-347) 
XP, СОЗА АОК, BI хОу ху! 表示 与 量 测 张 量 * 相对 应 的 量 测 误 差 张 量 。 
(一) 投影 旋转 因子 分 析 法 
【基本 思路 】 
投影 旋转 因子 分 析 法 (PRFA》 是 由 Burdick 等 针对 相 分 辨 荧光 光谱 仪 (PRES) 所 产生 的 
三 维 数据 的 解析 而 提出 的 ps 。 其 主要 思路 仍 是 基于 因子 分 析 法 , 不 同 的 是 它 巧妙 地 利用 了 张 
量 数据 的 性 质 来 进行 投影 旋转 ， 而 获得 有 物理 意义 的 唯一 解 。 下 面 将 对 此 法 进行 详细 的 介绍 。 
由 相 分 辨 荧光 光谱 仪 (PRFS) 所 产生 的 数据 可 用 下 式 表示 。 
М‹= У xydu-XDY (6-348) 
SUP, M, 为 在 频率 了 下 所 产生 的 二 维 荧光 光谱 。 其 中 只 和 站 一 1，2，…， n) 分 别 表示 第 
二 物种 的 荧光 激发 光谱 和 发 射 光 谱 矢量 ;Gyr 一 aeos [tan (er)] cos [gp 一 tan (axr;)], 在 
此 а, 为 一 依赖 于 荧光 物质 浓度 、 荧 光量 子 效 率 、 分 子 摩尔 吸光 系数 及 仪器 因素 的 常数 ，=m 是 
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Ж b PRI ARs bo 为 检测 器 的 相 角 。 另外 , ЖШ X= [x xm eels Y= [yu yee s, 
Jd) D, АВЕ, CHR £ TOMATO ds. ERIC RE EBE SF) 
的 频率 来 得 到 具有 不 同 频率 的 二 维 荧光 光谱 ， 以 构成 一 个 三 维 数据 阵 
в= Zx, Фуа (6-349) 

Ausland d. r]. FARAH Н. 

HA (6-349) RC RE =# OS YR r] RRR 

Bur= Dd.) des (6-350) 

RP, GO; 表示 荧光 激发 光谱 x, 中 的 第 i 个 元 素 ; (уо, 表示 荧光 发 射 光谱 y 中 的 第 j 个 元 
ж, 在 此 i=]，2，…, 上 ， 即 工 个 激发 波长 点 ; j=1, 2, =, M, 即 M 个 发 射 波长 点 ; /一 
1，2…，F， 即 下 个 不 同调 制 频率 ， 所 以 G 是 一 个 (LXMMXF) 的 三 维 数据 阵 。 

黑色 分 析 体 系 的 分 辨 算法 的 目的 就 在 于 直接 从 量 测 三 维 数据 G 出 发 , 分辨 出 纯 组 分 的 莹 
光 激发 光谱 nA, 2, =" n), KARELENS., 2. +з, я) 以 及 与 组 分 浓度 有 关 的 
Qtk 一 1，2，*…，n) 来 。 投 影 旋转 因 子 分 析 法 (PRFA) 的 解析 思路 是 首先 通过 多 维 尺度 分 
析 的 TUCKALS2 FAK RET М, 的 共同 列 矢量 空间 上 U 及 其 共同 行 矢量 空间 V, 然后 通 
过 适当 的 投影 和 旋转 技术 ， 即 可 得 到 分 辨 的 叭 一 解 。 以 下 将 对 其 投影 旋转 过 程 给 出 详细 
介绍 。 

【基本 算法 】 

投影 旋转 因子 分 析 法 解析 的 基本 过 程 可 由 下 述 几 步 构成 ， 

OO 投影 运算 过 程 ”用 共同 行 矢量 空间 UV AHMAR V 对 不 同 М, 的 进行 投影 ， 
即 


M; =U(U'U>lU'M VV 
=uUCy;y' (6-351) 
从 式 (6-351) 可 以 看 出 Cr 是 一 个 Xn) 阶 的 方 阵 。 
(2) 旋转 分 辩 过 程 ”因为 品 和 矩阵 的 列 向 量 与 X 矩阵 的 列 向 量 张 成 同一 线性 空间 ,， 且 VY 
矩阵 的 行 向 量 与 矩阵 的 行 向 量 张 成 同一 线性 空间 ， 所 以 ， 总 可 以 找到 两 个 (xXn) Epi 
RAR PT. 018 


X=UP 和 Y=VQO (6-352) 
Ж (6-352) {ҢА (6-848) 式 
M;=UPD;QV' (6-353) 
继 与 式 (6-351) 比较 ， 即 M,—UC,V' -UPD,Q'V', LA 
C,—-PDQ (6-354) 
对 式 (6-354) POR MAR P-RAR (QU 1, 立即 可 得 
ру=Р ‘CQ + 
AAR. P 5 Q 可 通过 对 CC, RAH COC, 的 正 交 分 解 来 得 到 ， 即 
PUCC, P-DD;' (6-355a) 
或 
QC CQ" =DD, (6-355b) 
这 是 因为 


D.D. -P^C(g)?[P^C,(90 1]! 
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=рР\С(0'› QC pp CC, !P (6-356) 
这 就 是 (6-355a) 式 ， 同 理 ，(6-355b) 式 亦 可 依 此 推出 得 到 五 -了 P, D.D. kt, 再 利用 进 
PERDANA PAO RH (6-352) 式 即 可 求 出 英 光 激发 光谱 于 或 获 光 发 射 光 畜 了 来 。 

GO 求 取 共 同 列 矢 唱 空间 己 及 共同 行 矢量 空间 V" 的 多 维 尺度 分 析 过 程 ” 在 投影 旋转 四 
子 分 析 法 中 ， 求 得 不 同 M, 的 共同 列 撩 量 空间 忌 凡 其 共同 行 矢量 空 间 V 的 多 维 尺度 分 析 的 
TUCKALS2 方法 实质 上 是 一 种 交替 式 最 小 二 姜 法 。 此 法 主要 由 以 下 步 弛 所 组 成 ; 

O 先 求 出 共同 列 矢量 空间 0 或 共同 行 矢量 空间 V 的 切 始 解 , 在 此 , 不 失 一 般 性 , 我 们 先 
求 出 共同 列 矢 景 空间 上 U HAMR. DEMM, 进行 主 成 分 分 解 ,以 求 得 其 个 最 大 特征 值 所 
对 应 的 = 个 特征 向 基 来 组 成 初始 苹 ” 。 

CD VU FS ЗИК, MAAR U KRV. 然后 , 再 利用 所 得 的 子 米 求 新 的 忆 ， 
如 此 循环 ， 直 至 收敛 。 

即 对 于 s 二 1, 2, 0 

ad & PP =U OU) UÀ, x S MLPIM ,进行 主 上 成 分 分 解 ,以 求 得 其 个 最 大 特征 
值 所 对 应 的 个 特征 向 量 来 组 成 V; 

b) 令 p? cy? WOVE) VOM POM, 进行 主 成 分 分 解 ,以 求 得 其 4 个 最 大 特征 
秆 所 对 应 的 个 特征 向 量 来 组 成 

c) 如 果 所 求 得 的 上 Ve 一 UV 中 小 于 某 一 给 定 值 则 停止 送 代 ,否则 转向 a 步 。 

在 上 上述 交替 式 迄 代 过 程 中 ,收敛 是 很 快 的 , 实 因 在 每 步 的 求解 特征 值 和 特征 向 量 的 过 简 
中 ,就 相当 于 是 对 trace P (ZM PE МӘР? |$ trace Pe? CD M PY MOPE NAR RAE, 
过 程 ,而 trace SM My) BK trace >; M M BUR ILS IX —Á RAL BNR „ 

HE LR SEAR LOR HUS JE IE £ ОТ BS [Н] V° 后, 即 可 利用 它们 来 进行 
分 辩 了 。 这 样 的 一 个 过 程 , 也 是 一 个 不 断 接 除 噪声 的 过 程 , 这 一 点 在 本 章 升 头 讨论 主 成 分 分 析 
误差 理论 时 就 进行 过 详细 的 介绍 ， 

(二 ) 广义 著 消 失 因 于 分 析 法 

关于 三 线性 分 解 的 广义 秩 消 失 因 子 分 析 法 是 由 Sanchez 和 Kowalski 提出 "中 ,其 基本 思路 
仍 与 广义 物 消 失 因子 分 析 法 大 致 相同 , 即 利用 广义 特征 值 和 特征 向 量 的 方法 来 求解 三 维 分 辩 
问题 .在 此 , 它 将 不 局 限于 只 像 前 一 章 所 讨论 的 广义 秩 消 失 因 子 分 析 法 仅 用 两 个 矩阵 来 进行 求 
解 ,而 将 被 拓 广 至 多 个 矩阵 进行 直接 分 解 。 实 际 上 ,时 在 20 世纪 70 年代, 必 理 计量 学 的 研究 者 
就 指出 ,对 于 三 维 数 据 ,在 无 任何 附加 条 件 下 因子 分 析 法 就 可 能 求 得 唯一 解 2? "5 ,得 到 唯一 
分 解 的 必要 条 件 是 此 数据 应 为 一 个 三 线性 数据 , 即 

g= Уху @ z, 

在 三 维 数据 的 研究 领域 中 ,特别 是 在 心理 计量 学 的 研究 领域 中 ,一 般 都 把 上 式 称 为 
PARAFAC-CANDECOMP 模型 。PARAFAC-CANDECOMP 模型 对 上 式 求解 是 通过 一 个 交 
Sp RK SE RU Bl ALS HERE BAe Ж! у, RO AER E ER G0 ,然后 在 设 已 得 
Bly ERG Н) BERE Е ЖЖ x.) AER EBA т, Ma AM LER Un ,如 此 重复 ,直至 
ЖЖ. ЕЖЕ ДЕҢ (an), y) A Go VIAE A — A J B he) ER n x) ДР n ЖЖ 
系 的 组 分 数 。Deligny 46 1$ Jet LIER ALS 三 线性 分 解法 用 于 估计 色谱 柱 参 数 与 色谱 保留 
时 间 的 关系 "中 ;Appellof 和 Davidson 将 另 一 三 线性 分 解法 ,或 所 谓 的 Tucker-1 法 用 于 分 析 化 
学 的 色谱 /激发 /发 射 之 三 维 数据 ,Wold 等 也 将 Tucker-1 法 用 于 其 他 的 化 学 数据 ,如 化 学 
模式 识别 等 9"1, 关 于 这 些 三 维 数据 的 处 理 方法 在 文献 [186] 中 也 有 简要 介绍 ,下 面 主要 介绍 
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Sanchez ЖП Kowalski 提出 的 三 线性 分 解 的 广义 秩 消 失 因 子 分 析 法 。 
1. 三 维 张 量 是 由 两 个 同样 大 小 的 此 阵 M 和 M. 所 组 成 时 的 三 线性 分 解 的 广义 秩 消失 因 
子 分 析 法 
【基本 所 路 】 
最 简单 的 三 维 张 量 是 由 两 个 同样 大 小 的 矩阵 M 和 M, 所 组 成 ,不 失 一 般 性 , 设 式 8 一 
Узун 中 的 {z} 张 成 张 量 的 第 三 维 ,对 于 这 最 简单 的 情况 ,此 二 线性 模型 可 表 为 
M= Ух, @ у, (6-357a) 


= 
M= S unn (6-357b) 
= 


ЖР on 为 体系 的 组 分 数 。 可 以 看 出 ,二 (zn zz)。 对 于 黑色 分 析 体 系 , 我 们 的 目的 就 在 子 求 得 
(xd AM ye} 求 得 1 和 4) 后 .就 相当 于 求 得 了 各 纯 物 种 的 标准 激发 与 发 射 英 光 光 谱 或 是 纯 
物种 的 标准 色谱 和 光谱 ,它们 的 相对 浓度 即 可 {zi} 从 中 得 到 . 下 面 将 详 纤 讨 论 广 义 秩 消 失 因 子 
分 析 法 是 怎样 来 求 得 {x.) 和 {y:} 的 。 
设 iy} 是 一 组 线性 无 关 的 矢量 , 则 可 以 找到 一 个 这 样 的 矢量 了 ,使 得 

XY = 3, (6-358) 
AP ôA Kronecker ff 5 , ОҢ k= r 0,0, — 1, Ar 时 ,6% = 0, RA у 在 张 量 代数 中 
EA ГУ КШ ЖЕН re OER. ШЖ Y= yot E ER 
Poroy Be T d л TIERE USC HUS ВЕЕ ИҢЕ Y" SLE LAE ҮЗ БЕЙ 
一 个 广义 逆 , 因 ,YY 一 1,1 Зу Г, ШЖ ИМЕШ y 右 乘 式 (6-59) 的 两 边 ,立即 可 得 


My =z., (6-359a) 
М.у —zax, (6-359b) 

将 式 (6-359) 两 式 合并 ,有 
Miy zs = Moy za (6-360) 


Җ (6-360) 实际 上 是 一 个 广义 特征 值 -特征 向 量 问题 , 对 于 这 样 的 问题 ， 因 涉及 同时 将 对 钊 化 
问题 ,目前 有 效 的 算法 是 QZ 算法 ,然而 ,从 现 有 的 计算 数学 发 展 的 情况 看 ,只 有 当 М, IM, 都 
是 方 阵 时 QZ 算法 方 能 求解 ,所 以 ,广义 秩 消 失 因子 分 析 法 的 重要 步骤 首先 就 是 将 M. MM, 都 
预先 转换 成 为 方 阵 。 

将 M. 和 M; 都 转换 成 为 方 阵 面 又 不 委 失 信息 的 方法 一 般 可 以 采用 同时 主 成 分 分 解 来 实 
BL. SPRL, 使 用 本 节 (一 ) 讨论 的 多 维 尺度 分 析 的 TUCKALS2 方法 也 是 可 以 实现 将 M. 和 
М, 都 转换 成 为 方 阵 面 又 不 丢失 信息 , 但 为 保持 介绍 广义 秩 消失 因 于 分 析 法 的 原始 性 , 在 这 里 
将 Sanchez 和 Kowalski 提出 的 算法 给 出 详细 介绍 。 

【基本 算法 】 

《1》 降 维 过 程 ”此 降 维 过 程 是 通过 求 得 该 两 矩阵 的 共同 列 向 量 或 行 向 量 空间 的 基 向 量 继 
用 投影 而 完成 的 。 下 面 将 分 别 给 予 简 要 介绍 。 

O 求 取 共 同 列 向 量 和 行 向 其 空间 的 基 向 量 过 程 HA M= Dan Qn = Nes 在 
此 ;==1，2, 即 只 有 两 个 同样 大 小 的 矩阵 ， 所 以 ， 如 果 想 要 求 得 与 {x,》 张 成 同一 空间 的 一 组 
ERB (m), THM 和 М, 按 列 进行 扩展 ， 即 令 

M=[M.|M.J 

也 就 是 说 ,如 果 M. AM, 22457 BET CL Xx OAH RAM 矩阵 就 是 一 个 
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(LX 2M ) 阶 的 矩阵 ,这 种 方法 在 线性 代数 中 称 为 展开 方法 。 此 时 如 果 对 M 进行 奇异 值 分 解 的 
话 , 就 可 以 取 其 得 分 矢量 以 得 到 与 {x} 张 成 同一 空间 的 一 组 止 交 基 {z1, 即 
MUSV' 
{4} 将 与 {xz} 张 成 同一 空间 。 间 理 也 可 将 M. 和 М, 从 男 一 个 方向 进入 展开 , 即 令 
"m 
M=! 
м. 
ERER WR M. AM 是 分 别 都 是 一 个 (Lx M) 的 阶 的 矩阵 的 话 .那么 ,M 矩阵 就 是 一 个 
(2LX MH) 阶 的 矩阵 。 这样 ,就 可 对 M 进行 奇异 值 分 解 后 取 其 载荷 矢量 以 得 到 与 {y,} 张 成 同一 
空间 的 一 组 正 交 基 {w}。 
@ 投影 降 维 过 程 ” 采 用 如 此 得 到 的 正 交 基 fe ,} 和 {fv ,1 所 构成 的 矩阵 口 和 VV 来 对 М, 和 
M, 进行 投影 运算 , 即 可 得 到 相应 的 不 玉 失 任何 信息 的 方 阵 , 具 体 可 依 式 (6-361) 进 行 
Mi,=U'M V (6-361а) 


K 
M.,=U'M.V (6-361b) 

在 此 -M's 和 Ms 分 别 为 М, 和 М. EER Ж lu Y Ay AR U LV. 的 投影 之 下 
所 得 到 的 两 个 方 阵 ,这 是 因为 已 SEDE JE AL x n.) Et SE £ M V 矩阵 则 是 一 个 CM X n.) BE 
En 在 此 表示 我 们 在 用 正 交 基 {wu ,} 和 tv ,} 构 成 矩阵 和 VV 时 所 取 的 主 成 分 的 个 数 . 所 以 ， 
Mis 和 Mz, THAT Xn Т. 为 不 丢失 原始 矩阵 М, 和 MM 的 信息 ,一般 可 将 n, RK 
点 , 即 大 于 分 析 体 系 的 实际 组 分 数 ,以 保证 在 以 后 的 广义 竺 征 值 -特征 向 量 问题 求解 的 QZ Я 
法 可 顺利 进行 。 另 外 ,细心 的 读者 可 能 会 提出 ,既然 上 述 所 得 的 正 交 基 {ww} 和 人 b ,分 别 与 (x) 
和 4?} 构 成 同一 线性 子 空 间 ,那么 ,Mi 和 对 xz 会 不 会 就 成 为 对 角 和 矩阵 ?由 对 M. 和 M, 分 别 直接 
3 1; 89 5B A) COT GEH DO LE EAE JE 5j Ges URL Cn у 6] — R 7s [8], 而 那样 所 得 的 正 
交 基 是 可 以 分 别 将 M 和 M. 对 角 化 的 ,不 同 在 什么 地 方 , 留 给 读者 自己 去 仔细 思考 。 

(2) QZ ARTE ”将 M1, 和 有 居 ;, 分 别 代替 式 C6-360) 中 的 用, A M: PUR EET: QZ 算法 计 
算 , 即 可 得 y 和 sn/zz， 为 求 得 纯 物种 的 标准 化 的 油 发 光谱 {x4} ,由 起 (6-359a) 及 (6-359b)， 
可 得 


x=My/ | My |i 
同 理 ,如 果 对 Му 和 М, 进行 上 述 过程 , 即 可 求 出 纯 物 种 的 标准 化 的 激发 光谱 {%} 来 ,这 
是 因为 像 式 (6-360) 一 样 ,可 得 式 (6-362》 
Mix z4 = Мога €6-362) 
【讨论 了 
以 上 已 将 三 线性 分 解 的 广义 秩 消 失 因 子 分 析 法 对 最 简单 的 张 基 分 辨 的 情况 作出 了 介绍 。 
它 虽 与 在 灰色 分 析 体 系 中 讨论 的 广义 秩 消失 因子 分 析 法 有 相似 的 地 方 ,但 已 知 条 件 和 求解 的 
目标 是 不 同 的 。 对 子 灰色 分 析 体 系 中 讨论 的 广义 秩 消 失 因 子 分 析 法 , 它 的 重点 在 于 定量 , 即 在 
FR (Chal 2. o0 ,然而 ,在 本 节 所 讨论 三 线性 分 解 的 广义 秩 消 失 因 子 分 析 法 , 因 对 (x.} 
和 {y.} 一 下 所 知 ,其 重点 首先 就 在 于 定性 , 即 在 子 求 纯 物种 的 标准 激发 光谱 {x,} 和 标准 发 射 光 
谱 {y%} ,从 这 个 意义 说 来 ,它们 又 是 不 同 的 ,当然 , 解 题 的 思路 也 不 同 了 。 
另外 ,在 此 还 值得 强调 指出 的 是 ,虽然 三 线性 分 解 的 广义 秩 消 失 因 子 分 析 法 并 没有 什么 特 
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殊 假 设 , 但 是 .该 法 仍 存在 一 些 约束 条 件 , 这 对 于 正确 使 用 该 法 将 十 分 重要 ,所 以 在 这 里 有 必要 
给 出 介绍 。 

(D 对 于 饭 式 (6-360) 和 式 (6-362) 所 给 出 的 无 约束 广义 特征 值 -特征 启 量 的 间 题 ,有 可 能 出 
现成 对 的 复数 特征 值 ,而 这 在 本 文 所 论 及 的 校正 和 分 辨 的 领域 中 是 没有 意义 的 ,需要 作出 相应 
变换 , 转 成 实数 解 。Li 和 Gemperline 对 此 进行 了 详细 研究 .读者 可 参阅 文献 [73]。 

© 从 式 (6-360) 和 式 (6-362) 所 给 出 的 广义 特征 值 -特征 向 其 的 问题 可 以 看 出 , 凡 属 于 м. 
和 M. 的 零 空间 的 任何 向 量 e 都 能 以 任意 特征 值 满足 上 述 两 式 , 实 内 此 时 有 Mse 一 0 如果 得 到 
了 这 样 的 解 ,必须 除去 才 行 。 我 们 可 以 采用 式 (6-363) 来 检验 所 得 的 解 是 否 属于 M. 和 M. 的 零 
空间 矢量 ,如果 

My == 0 (6-363) 
成 立 , 则 说 明 所 得 的 解 为 М, 和 M. 802245 [e PO Pl GARA. ER +E aj DUR ЗАВ О ER 
分 投影 方法 来 避免 所 得 的 解 落 入 M 和 M. 的 零 空 间 和 降低 噪声 影响 。 

© 三 线性 分 解 揭 广 义 秩 消失 因子 分 析 法 虽 对 于 数据 无 特 妹 要 求 ,但 为 求 得 有 真实 物理 意 
义 的 解 , 它 仍 要 求 М, 和 M. 都 是 双 线 性 矩阵 以 及 矢量 集 ix, ;和 1y} 为 线性 无 关 矢量 。 

(D 对 于 三 线性 数据 的 浓度 矢量 zs(% 一 1,2,…,n) ,广义 秩 消 失 因 子 分 析 法 要 求 它们 不 能 
对 应 成 比例 ,地 它们 不 能 是 指向 同一 方向 的 矢量 ,从 即 必 须 有 nasla | |。 如 果 这 一 条 件 不 
能 满足 , 它 将 导致 所 得 结果 不 可 靠 。 

2， 三 维 米 量 是 由 己 个 同样 大 小 的 矩阵 M 所 组 成 时 的 三 线性 分 解 的 广义 秩 消 失 因子 分 
析 法 

【基本 思路 】 

将 有 号 个 双 线 性 矩阵 ， 即 


Mo Mun» (86-3642) 
各 

M= Tux y (6-364b) 
£ 

Mo= >) ewt © у, (6-3640) 
€ 


Z= (zn La mp), CA=1 2,0), 


这 样 ,可 以 得 到 DCLD 一 1)/2 个 广义 特征 值 -特征 向 量 的 求解 问题 , 即 


My za —Miy en (6-365а) 
My za —My zio M.yz = Муза (6-365b) 
Miy z= Moy 25 Miy zo Moy za Mp1y о =M vy 2o (6-365d) 


对 于 由 式 (6-365) 所 表 出 的 广义 特征 值 -特征 向 量 的 求解 问题 ,由 于 量 测 噪声 的 存在 ,是 很 难 找 
到 一 个 像 前 述 只 含 两 个 矩阵 的 那 种 简单 情况 那样 的 单个 来 直接 求解 PCD 一 1)/2 个 广义 特 
征 值 -特征 向 量 问题 的 ,而 且 ,对 子 这样 多 个 广义 特征 值 -特征 向 量 的 求解 问题 ,还 不 能 保证 其 
中 任意 两 个 矩阵 都 存在 共同 的 矢量 集 {} 和 tys) ,因此 ,对 于 由 上 述 式 子囊 出 的 广义 特征 值 - 特 
征 向 量 的 求解 问题 需 另 辟 新 径 。 

与 前 述 只 单纯 从 两 个 邱 阵 来 考虑 广义 特征 值 -特征 向 量 问题 求解 的 思路 相反 ,我 们 可 以 找 
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两 个 可 代表 所 有 D АЗЕ BE DERE, BE MARERA RRR. e 
S= Улем, 6-366) 


式 中 ,p=1,2, 所 以 ,3, 为 两 个 与 原来 万 个 M.Q= 1.2... DE EAH HE E BERE 
P Bk HE ТЇ БЕЛО Ж PE o Co 1 2:&— 1,2 ,号 ) 为 其 线性 组 合 系数 ,它们 的 正确 选 定 将 
成 为 多 个 广义 特征 值 -特征 向 量 求解 问题 的 广义 秩 消失 因子 分 析 法 的 关键 , 因 将 式 (6-366)7 展 
开 可 得 


p 


А , 
Swat = Dw zn, Q y, 
a А "= 


: 5 
= У @ y, X wura 
4 ay = X алану 


s= У 9» Sunes = а, Y „@ у.) ‹6-367) 

76-367) AA Н ,а,(2—1,2: Lade oO RUIN SIH HR S, 能 成 为 所 有 > 
x,Qy, 的 线性 组 合 。Sanchez 和 Kowalski 提出 的 三 线性 分 解 的 广义 秩 消失 因子 分 析 法 是 通过 
PRA EIR wa(pm 1 2i4—1.2,7 DIN. 

从 图 6-69 可 以 看 出 ,任意 一 个 三 线性 张 量 可 以 从 二 个 方向 进行 展开 .下面 将 用 展开 的 方 
HER w(p=1s2:k= 1,2, 02. FORE D PAB TRA REPE MiCE 1,2 n DOE y 方向 进 
行 展开 ,这 样 可 得 一 个 CDX ML) 阶 的 和 矩阵 ,将 其 记 为 Mo, 对 其 进行 主 成 分 分 析 后 取 其 两 个 对 
应 于 最 大 特征 值 的 得 分 矢量 来 作为 w(z 一 1,2), 这 样 取得 的 几 (2=1,2) 可 满足 内 za 天 0 的 条 
件 ,以 保证 可 将 由 个 相同 大 小 矩阵 x09 y | — 1.2, ,1) 的 信息 都 包括 在 S, 中 。 当 然 , 求 w 
(p 二 1,2) 不 局 限于 这 一 种 方法 , 别 的 方法 也 是 可 行 的。 只 要 能 将 2 个 相同 大 小 矩阵 xy (r= 
1,2, ,2 的 信息 都 包括 在 S, 中 即 可 。 


S, 


开 
К [x za xp 209 Y] 
D^ 


三方 向 展开 
[Danie Fy EIT] 


x 
Goo ENBIL, 


方 | 
向 


Н [Ey Ze XH E Jg TLE] 
图 6-69 三 线性 张 景 的 三 个 方向 展开 示 瓷 图 


【基本 算法 】 

由 品 个 同样 大 小 的 矩阵 M, 所 组 成 张 量 的 三 线性 分 解 广义 秩 消 失 因子 分 析 法 的 具体 算法 
由 如 下 步骤 构成 : 

(1) 用 Tucker-3 模型 将 一 个 阶 数 为 CLXMXD) 三 维 张 量 % = Xy Ou 转化 成 为 两 
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охо ВЕ M. MM. 在 此 , 工 为 激发 光谱 的 波长 数 ,4 为 发 射 光谱 的 波长 数 ;D 为 不 
同样 本 的 量 测 所 得 的 二 维 光谱 矩阵 的 个 数 ;n 为 体系 化 学 组 分 数 (实际 上 它 是 未 知 的 )。 
(D 将 三 维 张 量 -& 按 z 方 向 展开 (参见 图 6-69), 得 到 一 个 {LXMD; 阶 年 阵 后 ,对 其 进行 
主 成 分 分 解 , 继 取 其 中 个 得 分 矢量 构成 -个 与 失 量 集 .x: 张 成 同一 线性 子 空间 的 矩阵 : 
[Mi | |My ]=U-S,V.' HS U-U(GXm») 
RPU 为 一 :LX#) 阶 矩阵 , 它 收集 了 前 个 得 分 矢量 ， 
@ 将 三 维 张 量 -4 按 z 方 向 展开 (参见 图 6 69), 得 到 一 个 (MXxZD) 阶 矩阵 后 ,对 其 进行 
主 成 分 分 解 , 继 取 其 中 个 得 分 矢量 构成 一 个 与 矢量 集 {y, ` 张 成 同一 线性 子 空间 的 第 阵 : 
(Mil |My]=U,SV, 并 令 V=U, Ln) 
SURV 为 一 MX) 阶 矩 阵 , 它 收集 了 前 个 得 分 矢量 。 
@ 将 三 维 张 量 -& 按 y 方 向 展开 (参见 图 6-69), 得 到 一 个 (DX МУЧЕ ВЕЕ АНТ 
主 成 分 分 解 , 继 取 其 中 两 个 得 分 矢量 构成 个 与 矢量 集 {zi} 张 成 同 -" 线 性 子 空间 的 逢 阵 W; 
Суад, Qae | yan Que] = USV 并 令 WwW=U DxX2) 
Tell. W 为 一 CDX2) 阶 矩阵 , 它 收 集 了 前 两 个 得 分 炙 量 。 
O 将 三 维 张 量 -4 投影 于 {2% v ) 为 基 的 特征 空间 之 上 ,以 得 到 两 个 (wxn) 阶 的 矩阵 
M, fll M2, 


А D 
M= X wa UMV), M, = wu MV) 
a El 


C2) ЖЮ ох LT RE Ee MOREM 来 进行 广义 特征 值 -特征 向 量 问题 求解 
(D 使 用 QZ 算法 以 得 到 满足 下 式 的 特征 向 量 x, 
MY A, = Mx А. 
D 将 所 得 的 个 特征 向 量 x Cr 一 1,2,….n) 收 集 以 构成 一 个 簿 阵 , 继 求 得 它 的 逆 , 记 为 站 


y) Ж А 
Ml c NS 
At. 
M 


6-70 ”三 个 模拟 混合 体系 的 二 维 光谱 图 
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D RH OZ 算法 以 得 到 满足 下 式 的 特征 向 量 了 ， 
M yÀs -MiyA. 
CO REBCRE IU п ДУН ШЫ y GC — 1,2, URL A AERE ARIE Wt Y 
CD 求 纯 物 种 的 激发 光谱 {x,} 和 发 射 光谱 iy,} 及 其 相对 浓度 iz,} 
(D X=UX fib X BERE T nA REG 
Q Y-Vy 在 此 7 EERE P» PREY): 
O 用 求 得 的 激发 光谱 {z<} ж Ж ЯТ ЖШ Cy.) DECR ЖШ R HE BEBE D + — # BE RJ B£ 
MG — 142,77 DOHA ABE. 
Ma = ux yen dez Dy. Gc1,2, D) 


VARA GL. 


220 07 260 280 350 400 150 500 
波长 Anm 波长 /nm 
(a) (b) 


220 240 260 280 350 — 100 4506 500 
波长 /nm 波长 /nm 
(e) (D 
图 6-71 采用 全 部 样本 的 二 维 莹 光 光 谱 之 线性 组 合 的 广义 秩 消 失 
因子 分 析 法 的 计算 所 得 结果 

GO BRA CO. RAH GH (c) TRIER BOO. 

(D RADE (e> AM A CO RM AACE 
【讨论 】 
Sanchez 和 Kowalski 用 广义 秩 消 失 因 子 分 析 法 对 -个 模拟 的 三 组 分 荧光 二 维 光谱 体系 进 
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fr T HERE ТА AY — e RES ARE ЖЕ ЖЕЛЕ A Ж БЕЛ ЖЫ. PE k 
A #80.1,2) EE BOS (21,22 K С (1,1,1). 三 个 样本 的 二 维 荧光 光谱 图 分 别 示 于 图 
6-70。 在 每 个 二 维 荧光 光谱 中 均 加 入 了 1% 的 正 态 分 布 的 明 测 误差 。 

图 6-71 未 出 了 从 三 线性 直接 分 辨 的 广义 秩 消 失 因子 分 析 法 , 即 采用 全 部 样本 的 二 维 荧 光 
光谱 之 线性 组 合 的 计算 方法 的 所 得 结果 ,从 图 6-71 可 以 看 出 .所 得 结果 是 相当 令 人 满意 的 .图 
6-72 示 出 了 只 用 样本 A 和 马 来 计算 的 广义 秩 消失 因子 分 析 法 的 计算 结果 ,因为 两 个 样本 的 相 
对 浓度 比 A/B 为 (0.5,1,1), 即 和 荧 草 的 相对 浓度 比例 是 相同 的 ,所 以 * 击 时 的 广义 秩 消 失 因 
子 分 析 法 的 计算 结果 对 于 这 两 种 物种 是 不 令 人 满意 的 ， 


220 240 260 280 350 — 400 450 500 
波长 /nm 波长 /nm 
6] (a) 


3h) 6 200 280 350 400 450 500 
波长 /nm 波长 {nm 
(e) (D 


图 6-72 只 采用 样本 4 和 号 的 二 维 荧 光 光 谱 来 计算 的 广义 秩 消失 因子 分 析 法 的 结果 
G) ИЕН D ЖЕЛШ: cO. 前 激发 光谱 ， 
(D BEA) RAM (D X RIER 
此 外 ,还 值得 提出 的 是 ,在 广义 秩 消失 因子 分 析 法 的 计算 中 ,对 于 组 分 数 的 估计 也 是 一 个 
TREE ИТЭ Ф, А Sanchez 和 Kowalski 的 经 验 , 对 组 分 数 的 估计 过 多 对 结果 影响 不 大 ,多 估 
计 的 组 分 所 对 应 的 是 噪声 谱 , 很 容易 甄别 ,但 是 ,如 果 对 组 分 数 估计 不 够 , 即 小 于 体系 实际 组 分 
数 时 ,对 结果 影响 很 大 ,而 致使 所 得 结果 不 可 靠 。 
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第 七 章 ”化 学 模式 识别 


化 学 模式 识别 (Chemical Pattern Recognition) 是 化 学 计量 学 研究 中 的 一 个 十 分 重要 的 内 
容 ， 它 从 化 学 其 测 数据 (包括 由 多 元 校正 和 多 元 分 辨 取得 的 定性 定量 成 分 数据 ) 出 发 ， 进 一 
步 揭示 物质 的 隐 仿 性质， 为 分 析 化 学 家 提供 了 十 分 有 用 的 决策 性 信息 。 模 式 识 别 的 计算 过 程 
可 有 如 下 步 台 :根据 实验 得 来 的 … 批 训练 点 ， 参 照 化 学 (或 物理 ) 模型 或 经 验 规律 提出 一 批 
特征 量 ， 然 后 进行 进一步 特征 抽取 以 求 得 合适 的 特征 星 ， 张 成 模式 空间 或 特征 空间 
(feature spece)。 必 要 时 ,对 数据 进行 预 处 理 , 预 处 理 后 即 可 通过 模式 识别 算法 进行 训练 和 
TR, ARIS UA GARRI) 分 类 所 得 的 判 据 对 未 知 样本 进行 判别 〈 或 称 计算 机 预报 ) 。 
这 一 过 程 可 用 图 7-1 EARR. 


Lia. REM: NEN 
(训练 点 } БОК 


— Lo. ERR 
未 知 样本 一 ES * | OM 
图 7-1 模式 识别 计算 过 程 从 意图 


本 章 将 对 这 上 几 个 步骤 分 别 进 行 介绍 。 在 介绍 了 模式 空间 的 几 种 距离 与 相似 性 度量 、 特 征 
抽取 方法 及 模式 识别 的 数据 对 处 理 方法 的 基础 上 ， 将 对 日 前 在 化 学 计量 学 中 用 得 最 多 的 王 大 
类 化 学 模式 识别 方法 ， 即 所 渭 的 有 监督 的 模式 识别 方法 、 匹 监督 的 模式 识别 方法 和 特征 投影 
的 模式 识别 方法 都 给 出 详细 的 介绍 ， 而 且 ， 各 类 方法 的 介绍 将 以 其 基本 思路 和 基本 算法 为 主 
线 ， 并 尽量 给 出 相应 的 计算 机 程序 .在 近年 来 的 化 学 计量 学 的 研究 中 ， 人 工 神经 网 络 和 一 些 
基于 全 局 最 优 算法 的 分 类 方法 受到 了 广大 化 学 计量 学 家 的 密切 关注 ， 对 于 这 些 化 学 计量 学 中 
的 模式 识别 新 方法 ， 本 章 亦 将 作出 介绍 。 


第 一 节 模式 空间 的 几 种 距离 与 相似 性 度量 


1. 化 学 模式 空间 
任何 一 个 化 学 样本 或 化 工 过 程 可 用 一 组 参量 x，( 矢 量 ) 米 表征 ,， Pl x= (ша. tee oe 
En) 在 化 学 模式 识别 的 文献 中 , 这 种 参量 值 又 称 特征 。 存 许多 
- 情况 下 ， 这 些 参量 实际 三 就 是 原始 化 学 量 测 数据 。 这样 的 一 组 
Zo n TERMAR ТЕЗЕ ARS Wt, 81—01 n HER 
- ”化 学 模式 ,由 这 样 的 化 学 模式 所 构成 的 维 空间 , 称 化 学 模式 空 
Toc 间 , 简称 模式 空间 ,一般 说 来 . 因 高 维 模式 空间 提供 了 更 多 的 信 
息 , 故 有 可 能 解决 -- 些 低 维 空间 中 难于 解决 的 问题 .这 种 情况 可 
容易 通过 网 7-2 说 明 。 从 图 ?7 2 中 可 以 看 出 , 在 一 维 空间 . BN 
cy 轴 或 z. 轴 , 单 用 ， 或 x+: 均 无 法 区 分 入 或 B, 但 在 二 维 模式 
图 7-2 在 一 维 空间 可 能 区 分 空间 , 可 以 由 一 条 直线 对 A 和 加 以 区 分 。 一般 而 言 , 仅 增加 
一 维 空间 不 可 分 的 二 类 样本 。 一 个 参量 , 难 有 如 此 显著 的 改善 .但 由 一 维 空间 (化 学 家 最 熟悉 
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的 ) М n 维 空 间 , x 越 大 , 改善 程度 愈 大 , 则 是 普遍 的 规律 。 这 也 号 化 学 模式 识别 近年 来 
受到 化 学 家 们 重 祝 的 根本 原因 。 

2. 模式 空间 的 距离 与 相似 性 度 基 

化 学 模式 识别 的 基本 假设 是 相似 的 样本 在 模式 空间 处 于 相近 的 位 置 ， 如 何 度量 两 个 样本 
在 模式 空间 的 远近 ? 这 里 可 应 用 在 几何 学 中 的 距离 的 概念 ， 它 在 模式 识别 中 是 作为 与 “相似 
性 ”相反 的 “ 相 异 性 ”的 度量 使 用 的 、 任何 满 足下 述 三 个 条 件 的 “ 相 异 性 ” 坞 可 定义 为 模式 
空间 的 距离 : 


@ D.,= D, 

@ DatDaZD,, 

A 083 ВВЕ MY REAR BBM, RES Ry “BHEE” ERG deg 
B” EANAN. ТЕРС Тар, ARMA RR RD TRS HOA REESE 

Minkowski 距离 ， 是 一 种 广义 距离 ， 对 于 n 维 空间 的 两 个 模式 矢量 x, 与 x,， 定 义 为 


D, мао = {È (04 — Xa i1 7 (7-1) 
特殊 情况 25 4 等 于 2 BJ „ШП H A BK SEE (Euclidian 距离 ): 

Do saos = Gra 7247)! * (7-2) 

Manhatten 距离 ; 
Dy, see |дата" (7-3) 

Haming FERS; 

Dy sss = YXOR Cram z.) (7-4) 

Tanimoto 距离 : 
D, soo 7 1— [EANDGa — ra) ХОВ Gu —24)] (7-5) 


ЕЖ, AND, OR 和 XOR SAAFAR “OS. “нй” ЯП HERE”. BELL, Haming fE 
BAM Tanimoto 距离 一 般 多 用 于 定性 数值 ， 即 9，1 类 型 数据 之 中 。 
如 果 样 本 是 服从 多 元 正 态 分 布 的 ， 一 般 还 可 采用 Mahalanobis 距离 、 习 惯 上 称 为 马 氏 距 
离 。 其 定义 为 : 设 x,x; 是 从 均值 为 wk, 协 方差 阵 为 Y 的 尽 体 G 中 的 样本 , 则 它们 之 间 的 Maba- 
lanobis 距离 为 
Dij. Matalat = (x,—x,)'V Qc x) (7-6) 
而 x, 与 母体 C 的 距离 则 为 它 与 均值 < 的 距离 ， 
D, „маракаи = Gr, ШУУТ (n, р) 
马 氏 距离 在 判别 分 析 中 的 距离 判别 中 有 着 重要 作用 。 
除 作为 “ 相 异 性 ?度量 的 距离 外 ,还 可 以 定义 在 此 基础 上 的 “相似 性 ?测度 。 模 式 矢量 x, 与 
的 “相似 性 "测度 5,, 可 定义 为 
Sg 1— [Di minton / Max (Омана) ] (7-7) 
AP, Max Dumon) 是 所 有 被 研究 的 数据 中 相距 最 远 的 两 个 模式 矢量 之 间 的 距离 。 显然 ,对 
于 同一 模式 矢量 ,5, 等 于 1， 即 完全 相似 ， 实 因 ,等 于 零 ， 对 于 该 数据 集中 相距 最 远 的 两 个 
ARRE, SETO, MEREU KEA Da 等 于 Max CDD. 
另外 ， 常 用 的 还 有 夹 角 余弦 和 相关 系数 。 
KARE 
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соз (0,,) = (Ул, X my x "m 
如 进行 谱 图 比较 时 ,此 夹 角 余 弦 蚌 一 个 很 好 的 相似 性 度 基 指标 。 
相关 系数 


cos(a,)=[2 (z, т.) X leum (V (aa m. Y x УМ‹т„—т°) 
UP ,m, A m, 分别 表示 第 i 和 第 j 个 样本 的 均值 . 即 mm Nard / ko 1.2570 ort 
文献 [.] 对 各 种 距离 和 相似 系数 作 了 一 个 汇总 介绍 ， 读 者 可 参阅 该 文献 。 


第 二 节 特征 抽取 方法 


选取 合 活 的 特征 量 ， 张 成 合适 的 特征 空间 ， 是 模式 识别 工作 成 败 的 一 个 关键 ， 特 征 量 的 
选取 标准 可 分 为 化 学 〈 或 物理 ) 的 和 数学 的 两 方面 。 化 学 〈 或 物理 ) 的 选取 标准 基于 对 所 处 
理 的 信息 的 本 质 或 主要 因子 的 理解 。 在 这 方面 ， 因 其 依赖 具体 问题 的 实际 情况 ， 在 此 无 法 指 
出 普遍 有 效 的 方法 。 由 于 对 所 处 理 的 信息 了 解 不 深 ， 而 用 往往 有 许多 因素 之 间 的 相关 关系 及 
程度 亦 不 能 肯定 ,因此 人 们 通常 是 先 根据 化 学 (或 物理 ) 的 选取 标准 尽 可 能 把 一 切 可 能 有 有 关 
又 易于 获得 的 因素 (特征 量 ) 都 所 出来， 然后 借助 于 数学 方法 ， 筛 选 出 对 分 类 作用 大 的 特征 
量 ， 张 成 合适 的 特征 空间 供 分 析 使 用 。 在 实际 的 计算 中 ， 人 们 总 是 力图 抛弃 那些 对 分 类 作用 
不 大 的 特征 量 , 使 特征 量 的 数目 (在 保证 良好 的 分 类 效果 的 前 提 下 ) 减 到 最 小 ,这 是 因为 :(D 多 
余 的 特征 量 不 但 没有 多 大 好 处 ,而 且 可 能 干扰 分 类 过 程 ; G; 为 了 保证 样本 数 和 模式 空间 维 数 
的 比值 大 于 3 最 好 是 大 于 10) ， 最 好 使 模式 空间 维 数 (特征 量 数 ) 降 至 最 小 。 

上 述 特征 抽取 的 说 法 似乎 与 前 节 中 讨论 的 维 数 越 高 ， 模 式 识别 方法 的 识别 能 力 越 强 之 说 
相 壬 。 实 际 上 ， 在 这 里 有 一 个 特征 变量 本 身 的 判别 能 力 和 它们 之 问 存 在 的 相关 问题 。 可 以 这 
样 说 ， 如 果 每 个 特征 变量 都 具有 一 - 定 的 判别 能 力 且 是 独立 的 ， 这 时 维 数 提高 使 模式 识别 方法 
的 识别 能 力 将 增强 之 说 是 正确 的 ， 因 为 每 增加 一 维 就 增加 了 新 的 信息 ;， 然而， 如 果 特 征 变量 
相互 相关 ， 此 时 ， 多 余 的 特征 变量 不 但 没有 多 大 好 处 ， 而 且 可 能 干扰 分 类 过 程 ， 这 是 由 于 增 
加 的 特征 变量 并 未 增加 判别 信息 ， 面 只 是 增加 了 运算 量 旦 还 可 能 带 来 模型 不 稳定 的 问题 。 也 
正 是 因为 这 一 点 ， 特 征 抽取 是 模式 识别 工作 成 败 的 一 个 关键 。 内 篇 四 所 限 ， 在 此 不 进行 更 多 
的 讨论 ， 读 者 可 参阅 文献 【2]。 以 下 介绍 两 种 单 变量 的 特征 抽取 方法 。 

设 原始 的 模式 矢量 含有 x 个 参量 , M nS ra tn), 在 所 有 的 样本 中 ， 可 以 设想 、 
方差 较 大 的 参量 ， 即 不 同样 本 取 值 差 异 较 大 的 参量 ， 对 分 类 应 当 贡 献 较 大 。 反 之 ， 如 某 一 变 
量 的 方差 很 小 (极端 的 情况 下 是 该 变量 对 所 有 的 样本 取 相 同 数 值 , 方差 为 零 ), 这 种 变量 对 于 
分 类 而 言 显然 无 意义 。 因 此 可 以 变量 i 的 方差 VY, 作为 权 因 了 于， 来 度量 变量 i 的 重要 性 。 
у= (XG—m)YY(-D (7-8) 


式 中 ,m, ЖШ í 的 均值 
m= Vaya) /n 
在 选择 变量 时 ， 将 V; 小 的 变量 优先 弃 去 。 

对 于 训练 集 包含 已 知 分 类 的 样本 ， 在 这 里 介绍 一 种 简单 而 又 有 效 的 特征 抽取 的 方法 ， 它 
可 以 容易 辨别 出 特征 变量 对 分 类 的 贡献 大 小 。 这 种 评估 特征 变量 的 标准 称 为 Fisher 权重 

Fina —mpY/ V Vs) (7-9) 

式 中 ,mn 和 mw 分 别 是 训练 集中 类 1 和 类 2 的 ;参量 的 均值 , VS V ЕВА ИНИ) 
i 变量 的 方差 ， 权 重大 ， 表 明 该 变量 ; 对 两 个 类 而 言 差别 大 ， 应 优先 选用 
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第 三 节 “模式 识别 的 数据 预 处 理 方法 


在 初步 选取 特征 变量 后 ， 模 式 识别 分 类 计算 之 前 ， 有 儿 种 应 该 采取 的 数据 预 处 理 方法 
(data preprocessing), 使 模式 空间 样本 代表 点 分 布 结构 改变 . 变 得 更 有 简 于 作 分 类 运算 。 例 如， 
各 特征 变量 取 不 同 量 网 的 数值 时 ， 如 果 有 的 变量 取 的 绝对 值 很 大 ， 而 对 外 一 些 变量 的 绝对 值 
很 小 ， 则 在 分 类 过 程 中 不 利于 获得 最 佳 结果 ， 因 此 应 当 用 标 度 化 方法 使 各 变量 的 变化 晤 度 处 
于 同一 水 平 上 。 下 面 介绍 几 种 这 样 的 标 度 化 方法 。 

OD 范围 标 度 化 (Range scaling) 

ТТ (7-10) 

EH z. RRR i 个 样本 的 原 有 的 第 j 分 量 ，7.,ww 代 表 第 i 个 样本 经 换算 后 的 第 j 分量 

Zu 代表 在 有 的 第 j 分 若 的 最 大 值 ,xia 则 代表 原 有 的 第 j 分 量 的 最 小 值 .范围 标 度 化 的 ~- 

个 缺点 是 ， 若 数值 集合 中 有 一 个 数值 很 大 ， 则 其 余 各 值 都 会 相差 不 大 ， 

(2) 自 标 度 化 (Autoscaling) 

ua = nuam m,)/V, (7-11) 

Җир, ,为 变量 j 的 方差 ,mu AER; 的 均值 , 自 标 度 法 是 一 个 很 好 的 方法 , 经 此 变换 后 , 各 
变量 在 分 类 过 程 中 影响 程度 相同 。 

(3) 标准 化 (Normalization? ”标准 化 预 处 理 的 方法 很 多 , 对 不 同 的 仪器 有 不 同 的 方法 
如 在 色谱 数据 中 常 采 用 面积 归 一 化 ， 以 减 小 进 样 误差 的 影响 ， 即 


Килен = ipia] 22 Gua? (7-12) 
面 对 于 质谱 数据 则 党 采用 最 大 归 一 化 预 处 理 的 方法 , 即 
арла = Ti, di MAN Gra) (7-13) 


(A) 变换 法 “另外 ,在 化 学 模式 识别 中 ， 还 常 采用 变换 方法 来 对 数据 进行 预 处 理 。 常 用 
的 有 
yam = Tad (7-14) 
Жу,» lg CT, oid) (7-15) 
以 达到 改变 数据 标 度 的 目的 ， 
(5) 组 合法 ”根据 不 同 的 情况 ， 将 原来 的 变量 ， 按 照 一 定 的 方式 ， 如 变量 相 加 、 变 量 机 
减 或 变量 相 比 等 进行 组 合 以 产生 新 的 变量 。 
总 之 ， 对 于 不 同 的 情况 可 以 采用 不 同 的 预 处 理 方法 ， 这 不 但 需要 正确 理解 各 种 预 处 理 方 
法 的 物理 意义 ， 同 时 也 必须 结合 不 同 问题 的 具体 化 学 经 验 来 对 康 始 数据 进行 预 处 理 ， 不 可 统 
而 论 之 。 


第 四 节 有 监督 的 模式 识别 方法 一 一 判别 分 析 法 


有 监督 的 模式 识别 的 分 类 方法 很 多 ， 这 类 方法 的 总 体 基 本 思路 都 是 用 一 组 已 知 类 别 的 样 
本 作为 训练 集 ， 即 用 已 知 的 样本 进行 训练 ,让 计算 机 向 这 些 已 知 样本 “学 习 ”, 这 种 求 取 分 类 
器 的 模式 识别 方法 称 为 “有 监督 的 学 习 ” 或 “有 老师 的 学 习 ”、 这 里 训练 集 就 是 老师 。 并 由 这 
个 训练 集 得 到 判别 模型 。 这 类 方法 一 般 可 分 为 参数 法 和 非 参数 法 两 类 ， 其 中 参数 法 一 般 由 统 
计 学 家 提出 ， 其 判别 效果 的 好 坏 依赖 于 样本 是 否 符 合 假设 的 统计 分 布 ， 而 非 参 数 判别 分 析 法 
多 由 实验 科学 家 或 计算 机 模式 识别 专家 提出 ， 对 样本 分 布 没有 特殊 要 求 。 在 这 里 我 们 将 介绍 
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几 种 最 常用 的 方法 ,包括 几 种 经 典 的 参数 方法 ,如 距离 判别 分 析 法 .Fisher 判别 分 析 法 、Beayes 
判别 分 析 法 逐步 判别 分 析 法 ，、 以 及 几 种 非 参 数 方法 ， 如 线性 学 习 机 、K 邻 域 判别 法 、 势 果 
数 判 别 法 、 人 工 神经 网 络 判 别 法 。 

为 答 测 所 得 的 判别 模型 的 判别 能 力 ， 还 常用 另外 一 组 吕 知 类 别 的 样本 组 成 测试 集 。 在 训 
练 中 所 得 的 正确 判别 率 称 为 识别 率 , 而 用 测试 集 所 得 的 正确 判别 率 则 称 为 预测 率 , 一 般 说 来 ， 
顶 测 率 对 模型 好 坏 的 判别 是 比 识 别 率 更 重要 些 ， 


-—. ERHI 


【基本 思路 】 

判别 问题 用 统计 学 家 的 请 言 来 说 就 是 ,有 上 个 总 体 GS Ozon ,G74; 它 们 的 分 布 两 数 分 别 是 
FíGO0 Fu GO 其 中 xz 为 = 维 的 样本 矢量 。 对 给 定 的 样本 =, 判别 分 析 法 的 目的 就 是 要 判决 
它 来 自 哪个 母体 。 一 个 最 直观 的 方法 就 是 计算 样本 x BG Gi GL WES dG) do, 
Gn de GO ,然后 根据 样本 x 到 它们 的 亚 离 来 确定 样本 的 归宿 , 即 

EG: 3l dlx, G) min {day G, di GO ered (Ga) } 

SRR Y Bš A A SB ds ANA EAER T 

BA BI IE SA ABA C GET ЖУ x 和 pw”, 协 方差 阵 分 别 为 VY 和 WV。 对 
给 定 的 一 个 样本 x, 距离 判别 的 方法 就 是 根据 它 到 母体 的 距离 来 判决 它 来 自 G, 还 是 G,. 即 

x€G, dG «do. G.) 


\хЄС,, d(x.G,) >d(x,G,) 
此 时 , 问题 是 该 采用 什么 样 的 距离 来 定义 样本 到 母体 的 距离 。 对 于 这 种 具有 分 布 函 数 的 母体 ， 
前 节 讨论 的 Mahalanobis 距离 比较 合适 。 下 面 将 简要 介绍 距离 判别 的 基本 算法 。 
【基本 算法 】 
COO BAA EAA A Ge Go 它们 的 均值 分 别 为 PIu”, WIERF, RA 
AY 的 情况 。 
CD 计算 任意 样本 x 到 母体 G, G, Mahalanobis HB. HA x ЯНЕ Ж С. С. 的 距离 实 
际 上 是 通过 样本 x 到 该 母体 的 均 什 矢量 и? 和 И? 的 Mahalanobis 距离 来 实现 的 ， 即 
а х0) = G—Ói?yy Gp) 
d'(x,G,) = Gr— f yy а?) 
© 计算 d'GG0—d'Go G0 , BB 
d'GGO—d' eG.) 
SO POY acu) oae 0) 
——20x— QE i72 TV. 1 GAP — um) 
4 d'G,G0—d' GG) e), (U ru /22 s Ж 
w(x) = —2[x— GP 0/2] 7 or —u) 
-—2-—guY*V ey 
@ 建立 相应 判别 准则 ， 即 
人 ax) 


x€ G, wx) >0 
对 于 母体 协 方差 阵 相 等 的 情况 ,距离 判别 函数 是 线性 的 。 
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(2) BAB EBS B G, Go 它们 的 均值 分 别 为 2"* 和 H2， 协 方差 阵 不 等 ， 即 分 
HABA У, V; 的 情况 。 
(D 计算 任意 样本 x 到 母体 С, С, 的 Mahalanobis 距离 ; 
dG)= (х), Gr) 
d'(x,G,)  Gr— 4)? V, Crp) 
加 建立 相应 判别 准则 ， 即 
pe d' GG) di ,G,) 


x€ G, d'G,G d GG) 
对 于 母体 协 方差 阵 不 等 的 情况 ， 判 别 函 数 将 是 非 线 性 的 。 
上 述 算法 很 容易 拓 广 至 多 个 母体 判别 。 


=, Bayes 判别 法 


Bayes 判别 法 的 主要 思路 是 建立 在 条 件 概率 和 统计 判 奖 理论 的 Bayes 定理 之 上 (SMB 
十 章 )。 在 介绍 Bayes 判别 法 之 前 ， 先 给 出 一 个 有 关 空 间 划 分 的 定义 。 

定义 OD, Do D 是 n 维 实数 空间 的 子 集 、 如 果 它 们 互 不 相交 ， 且 它们 的 和 就 是 
整个 维 实数 空间 , 则 称 А, Рз, е Dy 是 此 维 实数 空间 的 一 个 划分 。 前 节 讨 论 的 距离 关 
别 法 ， 实 质 上 也 是 建立 了 这 样 的 一 种 划分 

【基本 思路 】 

BA APE G, Go ns Ge EAT AGS APE AE ЛО), A) (不 一 定 
RESO), Hob n 维 的 样本 矢量 。 另外， 还 假定 这 个 母体 出 现 的 验 前 概率 为 a 
qo vogo Р, р) RRMA xk A G 而 误 判 为 G, 的 损失 , 则 对 给 定 的 一 个 样本 r, Bayes 
判别 方法 的 核心 就 是 找到 一 个 划分 ,使 得 在 此 划分 的 基础 上 计算 样本 被 误 判 的 平均 损失 , 即 
使 得 由 《7-16》 式 表 出 的 平均 损失 达到 最 小 : 


‚ 
g(D Da DOI= Va SLU PPG Do Dic D.) (7-16) 

SUH pli Di Dis DO RRA x RAG TRHA С, 的 概率 , 即 
PGI Di De DD |, onda Gan 


它 表示 f(x) 在 划分 D, 上 的 积分 HRA G 的 样本 x 出现 于 划分 D: 中 的 误 判 概率 . 下面 以 
& 一 2, 即 两 类 判别 情况 来 加 次 具体 说 明 。 
【基本 算法 】 
Bayes 判别 可 通过 以 下 步骤 来 实现 ， 
D 根据 经 验 多 定 两 个 母体 出 现 的 验 前 概率 为 9,,9:; 
@ 根据 判别 要 求 确定 误 判 损失 函数 元 4, 力 值 ,G 一 1;257 一 1 2) 如 无 特殊 要 求 ,一 般 设 
Кары 
Ш.Ш x€G LOI) —0,x€ G, DADS 
© HH Bayes 判别 函数 e 0 G=1,2); 
ex) —qLO,2)f i 
vy =q2L (2,1) fi) (7-18) 
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RUSE 0 (x)< а» (x) PEAS x BFC EZ HER x RT Со i k E hy b| Be ЕГШ НЕ) — A 
划分 D, Daa 
在 上 述 Bayes 判别 中 , 因 存 在 一 个 分 布 密度 函数 A), 它 是 不 确定 的 . 一般 都 假设 每 一 
类 的 样本 服从 多 元 正 态 分 布 , 所 以 , 在 .- 般 介绍 Bayes 判别 的 BAXE T, 都 是 以 多 元 正 态 分 
布 审 度 函 数 代入 (7-18) 式 来 进行 计算 的 ， 即 
FDS У, EO ехр Сб aH, 6020172) (7-198) 
Ро) = U/ [G7 1v; |"? ]expt Loc WV, Gu?) 1/2} (7-19b) 
3p. vov. 分 别 表示 第 一 及 第 二 类 的 协 方差 阵 ,#" ,x 分别 表示 第 一 及 第 二 类 的 均值 向 量 . 
这 样 ,前 述 的 Bayes Ж] BAM w(x) (i 一 1,2) 可 表述 为 
а =H LOS) AEC [Vii expl- [Gui V ЈИ (7 208) 
аһ(х)=,1,\2,1){1/[ 2% [V5 |" Tiexpt [tg yy; ew) 72! (7-20) 
XB LG P=, HUA LODA LO DEH 1, 8 CI200 RBH 
a (x) mq L/L [vi |! ехр = u OV at (7-2la) 
a(x) = {L/L (2m)? |У, |!'°])ехр{— НУ, 0 uy (7-21b) 
如 果 os GO «o; GO ВП 
gU Vi “}ехр!—[(х— VY oaa] 
qul IVa U Dexpbo lOve Wy o 21/21 


Фада 1 ?Фехр{—(х gy; aeu?) 
(IV, L erpi — Се ШУ. eant 

则 样本 x 属于 G1。 一 般 说 来 ,qi/gq: 可 看 成 常数 ,如 设 为 <. 则 上 式 可 变 为 
CIV; 2 expi— [Ge YV 1-47) ]/2)/ 


11м 2 )ехр - LG ah» Gea ]/21e (7-22) 
如 再 对 《?-23) 式 加 一 假设 , 即 设 第 一 及 第 二 类 的 苏 方差 阵 为 等 协 方 差 阵 , 此 时 有 
V.,=V,=V 


则 (7-22) 式 可 简化 为 
ехр{—[(х—И®)'У 1 G-- 79) ]/2) /exp(— Erp YV (а 000) 72022 (7-23) 


亦 即 

expl (х= pP VE i?) + Qm iV Qe P?) >e (7-24) 
对 (7-24) 式 两 边 取 对 数 

{a PYV a P+ Oc V Go iP) log (ed (7-25) 
亦 即 


人 一 GD 十 MY 一 Hiog(c) 
当 两 类 样本 的 验 前 概率 相等 时 ， 即 此 时 有 q, 一 g:，log (с) 一 0。 此 时 Bayes 判别 与 前 节 讨 论 
fF TDL ЕЛЕ. RH BUNC EAN. ERA 
别 与 Bayes 判别 是 完全 等 价 的 。 


=. Fisher 判别 法 
Fisher 判别 法 是 借助 方差 分 析 的 思想 来 导出 判别 函数 的 。 它 力争 找到 一 个 最 佳 线性 投影 
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方向 ， 使 得 沿 此 方向 投影 ， 可 使 类 间 方 差 与 类 内 方差 的 比值 达到 最 大 ， 故 Fisher 判别 法 一 般 
是 采用 线性 判别 函数 来 进行 判别 的 。 

【基本 思路 】 

Fisher 判别 法 的 基本 思路 是 先 计 算出 不 同类 别 样本 的 组 问 方差 和 组 内 方差 ， 而 后 构造 一 
个 组 间 方 差 和 组 内 方差 的 比值 。 显 然 、 如 能 找到 一 个 分 类 方法 ， 可 使 得 组 间 方 差 和 组 内 方差 
的 比值 达到 最 大 .当然 也 就 找到 了 一 个 最 佳 的 判别 方法 。 

BRA Rk МАНЕ С, Go vo Go 它们 的 相应 均值 和 协 方 差 阵 分 别 为 分 布 密度 函数 ， 分 别 
AU... b ;Vi,Vs,V4。 任 给 一 个 样本 矢量 x, 它 的 一 个 线性 本 数 由 w(x) 一 wx 表示 
出 , 则 母体 C, 的 均值 和 方差 的 线性 函数 可 表 为 


e=F[u(x) |G =u u i—1.2.-4 
vj! Var[uGo |G,] -u Vu ile 
记 
k В 
Bo= Me — Усе) (7-26) 
E = 
à n 
E,— Mw = Ylu'Vu (7-27) 


= ii 


Be Av? 都 是 标量 , 所 以 B 就 相当 于 一 元 方差 分 析 中 的 组 间 方 差 总 和 ， E, 就 相当 于 组 内 方 
差 的 总 和 。 邵 选择 一 个 上 使 


А (ш) =B,/E, (7-28) 
达到 极 大 ， 这 个 上 就 是 我 们 要 寻找 的 最 佳 投影 方向 。 令 
[a a a щ® 
8'— [?, н®, <, i] = ш? m? а 
и» ыт "n 
则 
B-8'[I- (1/k) J] 8 (7-29) 
AP, FRA. JA k Bre 1 矩阵 ， 即 
1 1 13 
1 1 1 
J= [l 1,9,1] = : 
1 1 1 
此 时 ， 有 
B, =a'Bu=u' O'U- (1/0 J] Ou 
—uw8'8y— (1/0) wO JOu 
"n 
т 
=a, аш, oy an) / " |- Q/D шуи 
| uw 


= Xt 2 Sear 
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在 上 述 计算 时 ,利用 方差 平方 和 的 分 解 性 质 , 即 其 平方 和 的 交叉 项 等 于 零 的 性 质 。 另 外 , 令 


à 
E= У) У, 
则 
n А 
E,= Уо! = У шуши En (7-30) 
a = 
于 是 A(u)=B,/E,= (u Bu) / (u Eu) 
Лоа, ВК OLA) 1/9u 2 0, Jen E 
|B—AE|=0 (7-81) 


亦 即 Ace) 的 极 大 值 为 上 述 方程 的 最 大 特征 根 ,而 此 最 大 特征 根 所 对 应 的 特征 向 量 即 为 最 佳 投 
影 方向 。 下 将 以 两 类 判别 情况 来 说 明 Fisher 判别 法 的 基本 算法 , 拓 广 至 多 类 判别 是 显然 的 。 
【基本 算法 】 
对 于 两 类 来 自 不 同 母 体 的 样本 ,zx езх n. m 其 中 (二 
1,2 i 51.2, n Ж ne) ARM 2 j AEU ;Vi We 分 别 表示 此 两 类 样本 的 均值 
向 量 和 协 方差 阵 。Fisher 判别 可 通过 以 下 步骤 来 实现 : 
CL) 计算 此 两 个 什 体 样本 的 类 间 方 差 BB 与 类 内 方差 EE 
B= 1/2) (4 =p? Сн PY" 
E=V.+V, 


则 此 时 有 
Alu) = (u'Bu) / Qi Eu) = [ (01/292! Ga? — 40) GEO — uP Vu J/Lu V+ Ve] 
(2) 计算 aTACu)]/Bu, 并 令 其 等 于 零 ,可 得 
(У Фина Ш — (7-32) 
Bp 
u= V, +V.) 0и — um (1-33) 
(3) 计算 Fisher 判别 函数 w(x) 
ouium 
xh um 0/2) HO — P? ) ROR o GO <0, ШЖ Ж x BT C. Dor HEE x AF С. XERA 
别 函 数 ,可 以 得 到 一 个 划分 Di Di. 
Di= (x t (x= 1070), Dy= x + a G—40sz0) 
在 此 是 从 母体 分 布 并 假设 它们 的 均值 向 量 和 协 方差 阵 已 知 的 条 件 来 讨论 的 ， 而 在 实际 的 
应 用 中 ， 这 些 参数 如 均值 向 量 和 协 方差 阵 都 是 通过 样本 估计 而 得 ， 如 设 样本 均值 向 量 和 样本 
协 方差 阵 分 别 为 系 和 SGi=1,2), 则 有 


V,=[1/@,—1)]1S, (7-34a) 
V.=[1/G2—1)]S: (7-34b) 

所 以 
9-02 [17 0 1218, (12 Gee -1) 8: (7-35) 


¥5(7-35) MARA (7-33) Sb BEA x: йй x; RE ЫС , 即 可 得 到 实际 样本 的 判别 函数 。 
KERE Fisher 判别 苇 的 计算 很 简单 , 即 只 和 需 计 算出 相应 不 同类 别 样本 的 均值 向 量 和 协力 
差 阵 ， 就 可 容易 得 到 Fisher 判别 函数 了 。 


337 


Д, ЖТЖ 


FER RA BST BAT) Bh A ЗЕН TAK BUE e B f 
特征 变量 的 数目 (在 保证 良好 的 分 类 效果 的 前 提 下 ) 减 到 最 小 。 这 是 因为 : OD 多 余 的 特征 变 
量 不 但 没有 多 大 好 处 ,而 且 可 能 干扰 分 类 过 程 ; 名 为 了 保证 样本 数 和 模式 空间 维 数 的 比值 大 
于 3 (最 好 是 大 于 10), 最 好 使 模式 空间 维 数 《 特 征 量 数 ) 降 至 最 小 。 本 节 要 讨论 的 逐步 判别 
分 析 法 就 是 这 样 的 一 种 方法 。 

为 检验 所 含 特征 变量 对 判别 效果 显著 性 ， 有 必要 在 此 先 介 绍 关于 判别 检验 的 两 个 统计 车 
及 其 检验 方法 。 

(一 ) 7? 统 计量 

T 统 订 车 一 般 可 用 来 检验 两 类 样本 之 间 的 判别 效果 。T* 统 计量 本 质 上 是 用 来 进行 均值 
向 量 的 检验 的 ， 它 可 用 于 检验 两 个 均值 向 量 是 否 具 有 显著 性 差异 ， 即 检验 是 否 

gogo 

PARR PSP {Н АГ Їй ERE EA EER BIR. 反之 ， 
如 果 两 个 均值 向 量 确实 存在 显著 性 差异 , 则 可 肯定 它们 不 是 来 自 一 个 母体 . AT? 统计 量 来 检 
验 两 类 样本 所 包含 的 各 个 变量 的 判别 效果 就 基于 上 述 事实 。 

Т [а ore! Gy tay) GE'S, X) (7-36) 
CP x; A x, 分 别 为 两 类 样本 的 样本 均 什 向 量 ,ni үл; 分 别 为 第 一 类 和 第 二 类 样本 的 个 数 


S=[1/ ntm 2] У Mon. ж) хь — XY 


由 于 ,F= (O En —2— D/DGi- m —2)0]}T? 
ЖАНН 5 nOn лаи 1E FG nim —n—l) ys, Xp s АРЕАЛ 
数 , 即 其 维 数 , 当 FF>F。, 则 表明 两 个 母体 的 均值 有 显著 性 差异 . 亦 即 样本 的 a 个 变量 可 以 区 分 
此 两 个 母体 .对 它们 的 判别 效果 显著 。 

(=) Wilks 统计 量 

Wiks 统计 量 是 用 来 检验 多 类 样本 的 估计 均值 向 量 是 否 存 在 显著 性 差异 的 ， 所 以 它 可 用 
于 多 母体 之 名 的 判别 效果 。 即 检验 是 否 

EE 
设 从 个 母体 G1 Gz. 6, 分 别 得 到 如 下 样本 ， 


(D мр a e 
XI YX, Xp 3t du 


eum uu E 
К АЕ SESS Н 


xxi y... ett А 
FER PG 1,2, ifm nat am) AB i 类 第 j 个 样本 ,它们 都 是 mm ТАТЕ, MEA m 
个 变量 的 向 量 , 各 个 母体 的 相应 均值 向 量 和 协 方差 阵 分 别 为 oo P V Ware Vis 令 


ñ 
n= Mns Х.К a= 2k 
= 


X=[X Xy Xi)! 
ДИ ЕО ë x KO HSE z 9 
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x= (1/n) У 
ais 
xn) Уух” a1. 
я 
同时 令 估计 总 方差 阵 为 LB 
一 оу) Ne EG? — xy = Xd, — in) DX (7-37) 


RP л IE ИТҮ 将 其 进行 平方 和 分 解 ,中 得 


w= Y ae =D PEY (7 38) 


= ууа S EO —gyc Saar- noon 
即 (7- 38) 式 中 的 第 一 项 为 类 内 方差 , 记 为 ET RR ARI RE i в, 
W=E+B 
而 在 多 元 方差 分 析 中 著名 的 Wilks 统计 量 可 定义 为 
=|E /|E+B:= |E|/.W| (7-39) 
式 中 ,|| 表示 行列 式 值 。 НААЖ ЕЖ ЯЯ т.л, 1, А Wilks 分 布 , 记 为 
A(m.n—k,k—1). 
(=) 附加 信息 检验 
所 谓 附 加 信息 检验 就 是 对 另 增 加 的 一 些 变量 进行 检验 ,检验 它们 是 否 能 提供 新 的 信息 , 亦 
称 附加 信息 。 设 从 让 个 母体 C，G，…， 人 分 别 得 到 如 下 样本 、 


эү м, m 
жї? xi etm 
D D e 
xU axi? axi x 
a w 
xx әх үз, л 


XB G—1,2, ki =m na on ERE RG MEA, EE m 维 向 量 , 即 含有 
到 个 变量 的 向 量 , 如 通过 基 种 步骤 已 选中 了 r 个 变量 ,要 检验 另外 (mm 一 >) 个 指标 对 区 分 母体 
是 否 提 供 附 加 信息 ,为 了 书写 方便 ,不 妨 设 选中 是 前 > 个 变量 , 记 


х9] am]. 
x = (7-40) 
x me Tl 
样本 的 均值 和 协 方差 阵 也 作 相 
— 
X 
FP mmi a=], 2, k 
E, E; (8а Bs 
E= в= | 
E, En Ba By 
Wi Wy 
W=B+E= | 
la wal 
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AT RF Un —r) ATE BERE ЕЕН ЛИЯ ,不 能 简单 检验 
y == x. y 
因为 这 么 做 是 将 前 7 个 变量 与 后 (xm 一 站 个 变量 完 侈 孤立 起 米 , 而 没有 考 虚 到 它们 之 间 的 相互 
作用 ,比较 合理 的 局 法 是 从 后 (mm 一 让 个 变量 中 将 前 7 个 变量 与 它们 的 线性 相关 部 分 扣除 , 继 
续 检验 剩 下 部 分 的 均值 是 否 相 等 ,也 就 是 说 在 给 定 前 个 变量 的 条 件 下 ,来 检验 后 Cm 一 让 个 


变量 的 条 位 均值 是 否 相等 。 
id x; 2 为 在 给 定 前 ;个 变量 的 条 件 下 后 Gm 一 +) 个 变量 的 条 件 均 第 ,如 要 检验 的 假设 是 
xXx. 
上 上 述 检验 可 通过 下 述 统计 量 来 进行 ”， 
Aen 5 
又 因为 
E=|Eu | Ez— EaE, ‘Evel 
W= IW || W45 —2WaáWi Wel 
[4 
4 JEI_| Ful | te LES EnEn Evel | 
оу ТИ! ТИ W.W. W|! 
id 
Aw Eu IW 
它 是 检验 前 > 个 变量 构成 的 样本 的 均值 向 量 是 否 有 显著 性 差异 的 Wiks 统计 量 , 即 检验 假设 
FO HF? FP Se aE? 
的 统计 量 , 所 以 有 
Kem = Aer Mow nio (7-41) 


《7-41) 式 很 像 条 件 概率 的 公式 ,由 于 Wilks 统计 量 有 这 个 好 的 性 质 ,在 逐步 判别 中 使 用 它 将 是 
非常 方便 的 。 
另外 ,Wilks 统计 量 ho 还 有 如 下 的 递 推 公式 : 


Д ДААА асо (7-42) 
ME E= (e,),W= Сил) M| (6-42) RGR S 
Am = (en Pw) еза. i / Waa int Ct Lion n'ont mn) (7-43) 
这 在 逐步 判别 中 使 用 起 来 更 为 方便 。 


【基本 思路 

逐步 判别 法 的 基本 思路 与 过 步 回归 基本 是 相同 的 ， 每 一 步 选 取 一 个 判别 能 力 显著 的 特征 
变量 进入 判别 函数 ， 然 后 ， 对 已 选 出 的 特征 变量 逐个 进行 检验 ， 检 验 它们 是 否 对 正确 判别 有 
显著 性 意义 ， 如 其 中 有 某 个 变量 由 于 新 变量 的 引入 而 变 为 不 重要 ， 即 对 正确 判别 无 显著 性 意 
义 ， 则 将 其 剔除 ， 直 到 判别 函数 中 所 包含 的 所 有 变量 判别 能 力 都 显 落 时 为 止 。 

本 节 下 面 将 讨论 的 逐步 判别 法 ,文献 [4] 对 其 已 作出 了 详细 介绍 并 附 有 程序 。 

【基本 算法 】 

CL) RERE x Go 1,2, naa 12 RRA m T AERE FEM i PE TT 
算 它 的 Wilks 统计 量 
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Ao = esfue, i=1.2, 
使 之 为 此 m 个 变量 中 的 最 小 。 为 叙述 方便 又 不 失 一般 性 ， — 选 的 次 序 来 
进行 的 ， 即 第 步 正 好 选中 变量 ~>。 第 一 步 选中 变量 1， 则 
Aq; —minAo = (ейи) i= 1.2, m 
iim 
考察 40) 是 否 落 人 接受 域 , 即 该 变量 是 否 对 判别 有 显著 性 意义 ,如 不 显著 , 则 表明 一 个 变量 也 
未 选中 ,不 能 用 判别 分 析 来 区 分 它们 ;如 显著 , 则 进入 下 -- 步 。 
(2) 在 未 选中 的 变量 中 ， "m Liu iu isis 


И Wr 


Aus |. 2<1<т 


Wa Un 


ju ер 
选择 Ла Ik BUR bE BE ЕЖЕ Да m AA o Ао KBR DS RE E 
Ac gs MRD, 

仿 此 ,如 已 选 人 了 > 个 变量 ,不妨 设 为 前 个 变量 , 则 在 术 选 中 的 变量 中 逐次 选 一 个 与 它 
们 配合 ,计算 


er 
ee 

Aasenc| i | : ME 
ел Ut е ы | 07 oe We Teer 
en ot be ea! | wn Wwe Wh 


选择 hoon НИЕ В * 十 1 个 变量 ,由 于 Aaen =“ Aca. At ozs fE Aa... n18 
到 极 小 等 价 于 使 4. 0 达到 极 小 ,在 此 基础 上 ,继续 检验 新 选 的 第 -十 1 个 变量 能 否 提 供 附加 
信息 ,如 不 能 则 转 入 (4) ,否则 转 入 (3)。 

(3) 在 已 选取 的 7 个 变量 中 ,要 考虑 到 较 早 选中 的 变量 中 其 重要 性 有 没有 较 大 的 变化 ,应 
及 时 把 不 能 提供 附加 信息 的 变量 剔除 ,删除 的 原则 同 于 引进 的 原则 , 如 在 已 进 人 的 > 个 变量 中 
考察 变量 JAS ЖАЛНЫ. RAB A, cy ry ro RRA BIA NY j, 并 检验 
ERDE ‚п Жш АСТ METO ,继续 考察 余下 的 变量 是 否 需 要 噜 除 ,如 显著 
则 回 到 (2) 。 

O 这 时 既 不 能 先进 新 变量 , 又 不 能 剔除 已 选 进 的 变量 , 将 已 选中 的 变量 建立 判别 函数 ， 
前 述 的 Fisher 或 Bayes 判别 函数 都 可 以 使 用 。 

从 上 述 算法 可 以 看 出 ,因为 每 步 都 要 计算 一 些 行列 式 , 似 有 必要 建立 一 套 既 经 济 又 方便 的 
计算 方法 ,在 此 将 介绍 一 种 在 逐步 回归 中 常用 的 消去 变换 法 。 

如 记 五 "为 没 被 变换 的 类 内 方差 矩阵 ,对 它 进 行 一 次 消去 变换 后 的 矩阵 记 作 EU = Ce), 
再 作 一 次 消去 变换 后 的 矩阵 记 作 EO = (ep) RA RAR OMICS. Bob. an 
记 第 -十 1 次 的 消去 变换 为 Tu( 即 进行 以 处 于 第 行 第 列 的 元 素 为 变换 中 心 元 素 的 消去 变 
换 ,要 求 eayzuu 不 为 零 , 对 于 所 讨论 类 内 方差 矩阵 和 类 间 方 差生 阵 , 因 它们 均 为 正定 称 阵 ,此 
条 件 自然 满足 ), 则 有 


ex je yx 
ер Гер E 

T.) genio (ya) . 《7-44a) 
1/60 i=j=k 


из ptr? fet 
eip — ep eip [ер ik jAk 
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Mw Sek 

ej wi 154 

Тыў =We? = Gel Dyd _ (7-44b) 
1/0 i=j=k 


uuu w TEk GAR 

上 述 消去 变换 法 具有 下 述 三 条 十 分 有 用 的 性 质 , 而 使 之 在 逐步 回归 或 逐步 判别 分 析 中 使 
用 起 来 特别 方便 。 

QT,T,QD-X 即 对 关连 续 施 行 两 次 相同 的 消去 变换 ,其 结果 是 了 不 变 ,这 很 容易 
直接 验证 。 

© Жр, ТТ) ТСТ, ХӘ) 这 表明 消去 变换 在 某 种 意义 下 的 可 交换 
性 。 此 性 质 也 很 容易 直接 验证 。 

О ЖЕТЕН ЕТЮ ТШИ ТЯ РИТЕ і Е 为 > 阶 正定 矩阵 ,因为 
E%=T (EO), E? —TA4QT) EU =T, E"), ДЕ, 的 行列 式 值 为 


IL - Dez ” 
РЕ 
表 7-1 给 出 了 更 清楚 的 结果 。 


表 7-1 消去 变换 过 程 中 的 子 北 阵 和 子 行列 式 计算 结果 


8% PUTU І Akh prem 
1 Du es 1 
c 45 
e f 
? in 
ep oew "єй 1,2 
- ul EN 
"n 
ence 
d Е КИП 
И «пей rei T? ПЕ 
eh tne 
AED eel er | 
Dum" 
пе өе Ve? 
r=1+1 eft Dane en 
ъз, 
«Чөн QED 


同时 ,在 上 述 讨论 的 消去 变换 过 程 中 的 子 道 矩阵 和 子 行列 式 计算 性 质 , 可 产生 下 述 结果 ; 
MA 一 ea 
Ao. =e e I=2, m 


n 
Ao mes fw i=3 nm 


从 上 述 讨论 的 消去 变换 的 三 个 性 质 可 以 看 出 ,如 在 逐步 判别 中 采用 消去 变换 ,将 使 前 面 讨 
论 的 有 关 逐 步 判 别 的 算法 变 得 颇 简 单 又 方便 ,这 是 因为 消去 变换 对 加 入 变量 和 噜 除 变 量 是 同 
ЋЕ, ААТ, (Т, (= Е 了 消去 变 澳 , 随 后 又 将 它 剔 除 时 还 
可 作 同 样 的 消去 变换 , 即 对 互 连续 施行 两 次 相同 的 消去 变换 ,矩阵 又 回 到 该 变量 未 引进 前 的 
ЖШ. AAR TACT, AVET (Ti) Gj) ЖШ REET АБЕ, Д] E" 与 这 些 变 量 
选 进 的 先后 次 序 是 无 关 的 .另外 ,因为 如 果 经 了 次 消去 变换 后 ,最 后 选中 了 r 个 变量 ,不 失 一 般 
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性 仍 可 假定 巧 前 x AEE, N Sai BY WE BI EC = Е Ыл] 
它 来 计算 Fisher 或 Bayes 判别 函数 来 。 

另外 ,这 样 以 Wilks 统计 量 A 的 值 作 为 日 标 咀 数 .用 上 述 逐 步 选 变 量 的 方法 求 得 Wilks 统 
计量 4 的 值 的 极 小 不 是 全 局 最 小 ， 只 是 一 种 局 部 最 优 解 ， 对 变量 选择 的 全 局 最 优 解 的 求法 也 
只 能 用 我 们 在 第 五 章 讨论 的 模拟 退火 法 、 遗 传 算法 或 基于 数论 方法 的 序 叶 优化 法 来 求 得 . 当 
然 ， 代 价 就 是 计算 更 复杂 ， 计 算 时 间 更 长 ， 

以 上 讨论 的 几 种 方法 都 是 经 典 的 参数 方法 , 下 面 介 绍 几 种 非 参 数 方法 , 如 线性 学 习 机 、 玉 
邻 域 判别 法 、 势 晒 数 判别 法 、 人 工 神经 网 络 判 别 法 。 


五 、 线 性 学 习 机 


【基本 思路 】 

线性 学 习 机 (inear Learning Machine) X ERER CE Fl Hl A BGK (Linear discrimination func- 
设 在 训练 集中 有 两 类 样本 、 记 为 由 Ao’. 线性 判别 函数 法 的 目标 是 找到 一 个 
它们 是 线性 可 分 的 ， 则 总 可 找到 一 个 矢量 w， 使 得 


x, Col, w'nl 


tion method; 


ха». ШЖ 


KE af. wie 
试 考察 -个 二 维 模式 空间 线性 可 分 的 例子 (图 7-3, w Mo! af ARIA (discrimination 
plane) AH. 在 相 例 中 ， 判 决 面 是 一 条 直线 ， 这 条 直线 是 通过 原点 的 ， 这 一 点 总 是 可 通过 举 
标 旋转 与 平移 达到 。 判 决 面 可 借 与 之 正 交 并 通过 原点 的 权 矢量 w 袁 述 。 试 计算 相应 的 点 积 *， 
s—wx,— | wll x [| costa) (7-45) 
ap Ab, а CABE. OR, m s EIE. Bo! 
35. dns 是 负 值 , x, а? 类 ， 所 以 判决 面 是 一 个 “分 类 
Lun 
从 这 个 简单 的 馆子 出 发 ,可 探求 如 何 求 出 判决 面 , 即 
找到 一 个 线性 分 类 器 。 求 判决 面 的 过 程 , 是 借助 已 知 的 wl 
KA w^ 类 样本 进行 的 ,这 一 过 程 就 称 为 训练 过 程 , 这 些 已 
知 样本 称 为 训练 集 . 设 一 组 已 知 分 类 的 样本 集 , 可 将 其 随 
机 分 为 两 部 分 , 一 部 分 作 训练 集 (或 称 学 习 集 、 参 比 集 } 用 
于 计算 判决 桓 ， 荔 一 部 分 作 预 测 集 (或 称 检验 集 ) 用 于 考察 找 出 的 判决 面 能 否 用 来 正确 地 预 
测 训练 集 以 外 的 样本 。 
【基本 算法 】 
线性 学 习 机 是 一 种 有 监督 的 学 习 类 型 的 简单 线 忻 判别 范 数 的 迭代 算法 .可 通过 以 下 步骤 
D 随机 选取 一 个 与 样本 矢量 具有 相同 维 数 的 矢量 作为 w， 
D 对 于 每 个 样本 都 进行 计算 (一 1，…-，z): 
ШЖ Can, ЩҢШЖ#ҥ'х>0, Джан, (R ЖШН ASE); 
反之 ， 如 果 w.<, „=н Ares CELE IRR BD 
ШЖ Ee", WEAR waco. Mw wa. HIRE RRR); 
BZ, Ш we > 0, Mw owe w. Axe (修正 判决 估量 ); 
在 这 里 A= 20 шлу) / || x, || ° 


BD 73 线性 分 类 器 示意 图 
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CD 重复 第 二 步 ， 直 至 对 所 有 的 样本 都 正确 分 类 

以 上 算法 是 对 于 线性 可 分 的 情况 而 设计 的 ,对 于 线性 不 可 分 的 情况 , 则 规定 重复 次 数 , 到 
了 规定 次 数 还 不 能 完全 将 湖 练 集 分 开 ， 则 认为 属 十 线性 不 可 分 的 。 

另外 . 在 本 算法 中 的 修正 判决 矢量 的 计算 ,实际 上 是 将 当前 的 不 能 正确 分 类 的 判决 矢量 
进行 反射 这 是 因为 


W... = (W tg AX.) X, 
ux, S 2 (Waata) Creed! || x, | 2 
= wa 
也 就 是 说 ， 经 过 这 样 的 修正 以 后 ， 原 来 不 能 正确 分 类 的 现在 可 以 正确 分 类 了 ， 一 般 说 来 这 样 
的 重复 次 数 在 20 次 左右 就 足够 了 . 


六 、K- 最 近邻 法 


【基本 思想 】 

-最 近邻 法 (K-nearest neighbor classification method, K-NN 法 ) 是 一 种 直接 以 模式 识 
别 的 基本 假设 一 一 同类 样本 在 模式 空间 相互 较 靠 近 - “为 依据 的 分 类 方法 。 它 计算 在 最 近邻 
域 中 不 个 己 知 样本 到 未 知 的 待 判别 样本 的 距离 ， 即 使 所 研究 的 体系 线性 不 可 分 ， 此 活 仍 可 适 
Hi. K 最 近邻 法 从 算法 上 讲 极为 直观 ， 在 这 种 方法 中 ， 实 际 上 是 要 将 训练 集 的 全 体 样 本 数据 
存储 在 计算 机 内 ， 对 每 一 个 待 判别 的 未 知 样本 ， 逐 一 计算 与 各 训练 集 样本 之 间 的 距离 ， 找 出 
中 最 近 的 K 个 进行 判别 。 

如 天 =1， 很 自然 这 一 个 最 近邻 样本 属于 何 类 ， 林 知 样本 即 判 属 该 类 。 如 天 >1， 则 这 天 
个 最 近邻 样本 不 一 定 都 属于 一 类 。 采用 “表决 的 办 法 ， 对 这 故 个 最 近邻 样本 的 归属 情况 , 按 
少数 服从 多 数 进 行 判 决 。 一 个 近邻 相当 于 一 票 ， 但 应 考虑 对 各 票 进 行 加 权 ， 国 距离 最 近 的 近 
邻 的 类 属 ， 应 于 以 较 重 的 权 。 例 如 按 (7-46) AIT: 

V. = DV/D, (7-46) 
ERE WK Co RS V. 1: MR x € n Vi = — 1; D, 是 待 判别 的 样本 与 近邻 的 距 
离 。 这 样 ,如 果 求 得 的 了 eree 为 正 , 则 可 认为 属于 中, 反之,z* LEM 
2 Vum 0, En 
而 Vomp 0s 0 хы 
D, 的 作用 相当 于 一 个 权 因 于 ， 即 如 朵 近邻 ; 与 样本 x 的 距离 很 小 时 , 它 权 值 就 大 ,而 那 
些 四 高 大 的 近邻 就 权 值 较 小 。 
【基本 算法 】 
天 -最 近邻 法 (K-NN 法 ) 算法 相当 简单 ， 可 由 以 下 步 又 米 完 成 ， 
OD 取 一 个 未 知 样本 ，、 记 为 rom， 计 算 该 样本 到 训练 集 各 样本 的 距离 DG — 1.2... 
7n), 在 此 为 所 有 训练 集 样本 的 总 数 。 
(2) 取出 大 个 距离 最 短 的 训练 集 样本 ， 计 算 它们 的 权 值 和 : 
Venta a= УУ, АР, C= 12 k) 
ШЖ z€ ol WRVS GRZ WR xE VSD, 是 待 判别 的 样本 与 近邻 的 距离 。 
(3) 建立 判别 标准 ， 即 当 
V mnom 27 0 > BI] x. 


DES wr 
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TU VV unkaa <0 5 ЖШ xuom 判 为 第 二 类 a 
XU RS >, 文献 中 多 有 讨论 ,但 很 难 有 一 定论 , 一 般 还 是 向 经 验 来 定 此 
外 ， 有 人 还 提出 了 一 种 交替 КММ (Alternative KNN》 方 法， 读者 可 参阅 文献 [6—8]. 


七 、 势 函数 判别 法 


【基本 思想 】 

势 函数 分 类 法 (classification with potential function) 实际 上 是 肛 - 最 近邻 法 (K-NN Ho 
的 一 种 很 有 效 的 括 广 变种 ， 它 把 每 一 个 已 知人 种 类 样本 的 代表 点 都 看 成 其 种 a ВН. A 
如 一 个 电场 源 即 一 个 点 电荷 。 在 距 某 点 距离 为 万 处 的 场 强 了 (D) af FERRARA; 


V(D)=1/D (7-47) 
T(CD) 也 可 采用 更 复杂 的 形式 ,如 
VO»-1/QrgD (7 48a) 
或 
TYCD) 一 em C7-48b) 
式 中 ,gq 为 可 调 参 数 。 


所 有 点 的 场 均 分 布 于 整个 空间 且 互 相 重 盖 。 对 于 木 知 点 属于 哪 一 类 的 判断 基于 这 样 一 个 

原则 :未知 点 属于 在 该 点 有 最 大 势 场 强度 的 哪 一 类 , 即 用 下 列 判 据 ， 
Vani = (1/21) ZV G4) т) XV Gr) (7-49) 

EP, VC) AV Ce SP RE i mls — 3 e 
对 未 知 样本 点 处 施加 的 势 场 , ж, э, 分 别 为 第 一 、 第 二 
类 点 数目 。Y。ooe 为 未 知 点 处 两 类 点 平均 作用 势 的 差 
值 . У D0, MJ v. a € i TN Уа 0, Д] хы. 
€ «^, УО 时 为 分 界面 , 一 般 为 复杂 的 不 连续 的 曲 
Ш. 图 7-4 表示 这 类 分 界面 的 示意 图 。 

【基本 算法 】 

势 函数 分 类 法 算法 也 很 简单 ， 可 由 以 下 步骤 来 


CL) 取 一 个 未 知 样本 , 记 为 wwe， 计算 该 样本 在 
已 知 训练 集 场 中 的 场 强 V... (D), Вр 

Vois D) = X Og DD G= 1.200 on) 

(7-59) 

在 此 为 所 有 训练 集 样本 的 总 数 ，D: 为 该 样本 到 训练 
集 各 样本 的 距离 ,g AMERY MURERE i 属于 
第 一 类 时 取 正 值 ， 而 当 训练 集 样本 ; 属于 第 二 类 时 取 负 值 。 

(2) 建立 判别 标准 ， 即 
H И (DY 05 Д] хона 188—0 әт 
BZ, Ушма 0) 0, BÍ guom 判 为 第 二 类 ал 

势 函 数 法 的 一 个 较 简 单 的 变种 是 只 考虑 一 批 近邻 的 势 的 方法 , 例如 , дек ES 
到 判别 函数 为 


图 ?-4 ЖЕТЕН 
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V unknown DOS T/A +g. DD G= 15250 k) (7-51) 
这 就 与 K- 近 邻 法 相似 了 。 


八 、 人 工 神经 网 络 判 别 法 


【基本 思想 】 

人 工 神经 网 络 方法 在 前 一 章 的 非 线 性 校正 方法 已 作出 了 ~- 般 性 网 介 绍 ， 在 此 只 对 其 在 化 
学 模式 识别 中 的 应 用 给 出 必要 的 补充 介绍 。 人 工 神经 网 络 帕 于 其 具有 非 线性 映照 的 能 力 ， 用 
于 化 学 模式 识别 应 该 说 是 有 一 定 优 势 的 ， 近 年 来 在 化 学 模式 识别 中 得 到 了 相当 广泛 的 应 
用 ”~ 本 节 仍 以 多 雇 前 传 网 络 误差 反 传 算法 为 主 来 作出 介绍 ， 

大工 神 经 网 络 用 于 化 学 模式 识别 的 基本 思路 与 前 述 的 判别 分 析 方法 是 相同 的 ， 它 也 是 通 
过 对 已 知 类 别 的 训练 集 的 拟 合 ， 来 建立 模型 来 进行 分 类 与 预测 的 。 它 与 第 六 章 中 讨论 的 非 线 
性 校正 方法 的 区 别 仅 在 于 校正 方法 的 拟 合 为 连续 变化 明 数 、 而 化 学 模式 识别 则 旦 以 0，1 或 
一 1、 十 1 为 其 输出 来 进行 拟 合 建 模 的 。 

[#444] 

用 于 化 学 模式 识别 的 误差 反 传 算法 算法 将 由 以 下 几 步 构成 : 

CD) 随机 选取 网 络 之 间 的 连接 权重 ww 和 wr (у=1. +, ni Em. se, m; k=1, се, 
工 )， 其 中 4 为 输入 矢量 的 节点 数 《 或 称 输入 矢量 的 维 数 ); m 为 隐 节 点 数 ; L 为 输出 节点 数 。 
一 般 就 用 (一 0. 5~0.5) 的 均 名 分布 的 随机 函数 产生 。 

(2) 贡 a 二 1，…，A， 重 复 选 代 进 行 以 下 步骤 ， 直 至 收 敏 : 

OD WEITE. 按照 下 面 两 式 来 计算 O, 

O, = FC игу, dw 
=F Set f (Sw, tw) tel) (7-52) 
RP. уу = Оо, tos), ВЕРЕР ВАЎ, HU Са) зоп (0) = 7, Си), 或 取 非 线 
性 反正 弦 函 数 /GO =тапА (и). SATB BEARER. Bok (7-53) HR HR Е, 
Е=1/2(500,-Е,)) (7-53) 

© 反 传 调节 : 计算 出 由 式 (7-53) 表 出 的 目标 函数 对 连接 权重 的 一 阶 导 数 ， 并 以 此 来 调 
THERE wp wp. СЕЊА TARERE. MUJAB- KFR IHRER A m 
Ње). 


Aw, = pü,u, (7-54) 
RP. p 为 一 步 长 因子 ,可 在 (0~1) ZARE: u 为 第 j 节点 上 的 抽象 变量 ， 一 般 视 其 是 在 
输出 层 还 是 隐蔽 层 ， 就 分 别 等 于 S/O wp dun RE f Owy Tat) 36 为 梯度 因 于 ,对 于 
不 同 层 , 有 不 同 表达 式 : 
(u ED Uuu) u 为 输出 节点 (7-554) 
"las Boon) ta CT-88b) 
在 这 里 x(1 一 四 一 必 。 因 为 
u=f Ye Hw D= (а) 17 dHe) (7-56) 
所 以 有 
и = faa Оет) — (ee (C1) 
= ет) C/U +e =a a) 
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式 (7-54) BEST о RUE K RACE ABA ИЛА, ШЕЯ KA. 则 可 能 引起 选 
代 过 程 的 振荡 ; 反之 ， 若 取 值 太 小 则 会 导致 权重 调节 的 迭代 过 程 收 敛 太 慢 。 一 般 说 来 ， 为 了 
加 快 选 代 过 程 且 防止 迁 代 过 程 的 振 葛 ， 一 般 是 在 式 中 引入 -ARRE А, 
Aw: (a+1) = pda, + AA. (a) (7-57) 

V ei C GRE 

尽管 人 工 神经 网 络 的 研究 已 取得 令 入 兴奋 的 进展 ， 伺 是 ， 总 的 说 来 对 它 的 研究 无 论 在 理 
论 还 是 应 用 上 部 还 处 于 初期 阶段 ， 还 存在 很 多 问题 值得 探 计 ， 如 网 络 训练 速度 、 过 拟 合 、 全 
局 寻 优 、 网 络 结构 与 网 络 能 力 等 问题 都 存 在 未 知 因素 ,值得 进一步 研究 。 污 者 叮 参 阅 文 
Ж [12~15]。 

第 五 节 无 监督 的 模式 识别 方法 一 一 谷类 分 析 法 

聚 类 分 析 是 多 元 统计 中 的 一 种 实用 性 很 强 的 方法 ， 其 主要 思路 就 图 利用 同类 样本 应 彼此 
相 做 ， 即 常 说 的 “ 物 以 类 聚 ”， 相 类 似 的 样本 在 多 维 空间 中 彼此 的 距离 应 小 些 ， 而 不 同类 的 样 
本 在 多 维 空间 中 彼此 的 距离 应 大 些 。 京 类 分 析 即 为 如 何 使 相似 的 样本 “ 绕 ” 在 一 起 ， 从 而 达 
到 分 类 的 目的 。 一般 说 来 ， 聚 类 分 析 方 法 可 分 为 凝聚 法 与 分 离 法 两 类 [5 口 ， 凝 聚 法 开始 时 将 每 
个 样本 认 作 一 个 类 ， 然 后 由 这 些 类 就 步 凝聚 成 较 大 的 类 ， 下 而 将 讨论 的 系统 聚 类 法 就 是 凝聚 


法 的 例子 ， 而 分 割 法 则 与 之 相反 ， 开 始 时 将 所 有 的 样本 认 作 一 个 大 类 ， 在 逐步 分 割 为 较 小 的 
类 ,以 后 将 介绍 的 一 分 为 二 法 是 分 割 法 的 - -个 例子 。 


—. ЖЖЖ 


【基本 思想 】 

系统 此 类 法 (Hierarchical Clustering Method) 亦 称 谱系 聚 类 法 , -PREMORE 
方法 ， 其 基本 思想 是 : 先 将 ”个 样本 各 自 看 成 一 类 ， 然 后 规定 样本 之 间 的 距离 和 类 与 类 之 间 
的 距离 。 开 始 ， 因 每 个 样本 自 成 一 类 ， 类 与 类 之 间 的 距离 与 样本 之 间 的 距离 是 等 价 的 ， 选 择 
距离 最 小 的 一 对 并 成 一 个 新 类 , 计算 新 类 与 其 他 类 的 距离 .再 将 中 离 最 小 的 两 类 并 成 一 类 , 这 
样 每 次 减少 一 类 ， 直 至 所 有 的 样本 都 成 为 一 类 为 止 。 

类 与 类 之 间 的 距离 有 许多 定义 的 方法 57， 它 与 前 述 样本 与 样本 之 间 鸭 距离 是 有 区 别 的 ， 
例如 定义 类 与 类 之 间 的 距离 为 两 类 之 间 样本 中 的 最 近 的 虹 离 ， 或 者 定义 类 与 类 之 间 的 距离 为 
两 类 重心 之 间 的 距离 等 等 ， 不 同 的 定义 就 产生 了 系统 聚 类 的 不 同方 法 ， 本 节 将 对 常用 的 8 种 
定义 类 与 类 之 间距 离 的 不 同方 法 进行 简要 介绍 ,为 区 别 样 本 之 间 的 虐 离 与 类 与 类 之 间 的 距离 ， 
在 以 后 的 讨论 中 ， 凡 是 用 小 写字 母 d 表示 的 为 样本 之 问 的 距离 、 而 用 大 与 字母 D 表示 的 为 类 
与 类 之 间 的 距离 。 

iE LITE 

RAR ke XE G, 与 G, 之 间 的 距离 为 

D, =minidao) (7-58) 


еб е0, 
式 中 ,dw 是 样本 x 5 xs ЕЕГ, BIDS E326 E By 2 Пар БИК DHL PES Z DE M PER 
【基本 算法 ] 
定义 了 上 壕 的 类 与 类 之 间 的 距离 ， 基 于 最 短 距离 的 系统 蘑 类 法 的 算法 可 由 下 述 计算 步骤 
组 成 : 
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《1) SUE FEE НОН O RTR ЕК БЕ E BE R MCI D TR FEE BE a OO XER 
E, BA Do， 开 始 每 个 样本 自 戌 -- 类 ， 这 时 显然 Dn 一 dx， 

(D 选择 Do MRD GK, RAD.» WHC, MG, SORGE. WAG, W, G= 
(С,.6,), 将 Do 中 pg TR p.q 列 并 成 一 个 新 行 新 列 , 新 行 新 列 对 应 Gr, DETE R JE BEWE 
fE Dare 

(3) 计算 新 类 与 其 他 类 的 距离 


Da=min!d,,} —mintminld,i. mintd 
кебей, теср, CO EU, 


= min (DaDa 
(D 对 Do 重复 上 述 对 Dw 的 计算 得 Do， 如 此 下 去 直到 所 有 的 元 素 成 为 - -类 为 止 。 
{二 ) 最 长 距离 法 
最 长 距离 法 定义 类 G, SC 之 间 的 上 距离 为 


D,— max idw (7-59) 
EG HES, 


式 中 ， 必 是 样本 x, Sun 的 距离 ， 即 类 与 类 之 间 的 距离 为 两 类 之 间 最 运 的 样本 之 间 的 距离 。 
由 于 最 长 距离 法 的 基本 算法 与 最 短 距 离 法 是 完全 类 似 的 ， 所 以 ， 在 此 只 给 出 计算 新 类 与 
其 他 类 的 递 推 公式 : 
D4- axd} 


TOEI 


=max{maxid,}+ maxid, }} 
ео ED асо eG, 


=max (Dm Dp) (7-60) 

(=) 中 间距 离 法 

从 上 还 对 最 短 距 离 法 和 最 长 距离 法 的 讨论 可 知 ， 它们 的 差别 只 在 于 两 点 : (D 类 与 类 之 间 
Е Ж], O 计算 新 类 与 其 他 类 的 距离 所 用 的 递 推 公式 不 同 。 下 面 将 介绍 其 他 系统 来 
类 法 之 间 的 差异 也 都 在 这 两 方面 ， 故 下 述 讨 沦 将 主要 介绍 新 类 与 其 他 类 虐 离 的 递 推 公式 。 

中 思路 离 法 定义 的 类 与 类 之 间 的 中 离 既 不 采用 两 类 中 样本 之 间 的 最 短 距离 ， 也 不 采用 两 
类 中 样本 之 阿 的 最 长 距离 ， 而 是 采用 最 近 和 最 远 之 间 的 哮 离 。 

如 果 在 某 一 步 将 类 G, 与 G, SHAG... 任 一 类 G, FC. 之 间距 离 的 取 法 可 由 如 下 三 角形 
HA (参见 图 6-6)。 如 果 用 最 得 距离 法 , DD, 等 于 Ds 和 Ds 中 短 的 一 边 ; 如 果 用 最 长 距离 法 ,DD 
等 于 DM О, 0—20, MERRER EH, DARRO ADR Ds，D,, 取 的 是 夹 在 中 间 
的 三 角形 中 线 ， 由 初等 几何 知 

Tie PR =[(1/2)Di,+ 1/2)DL— A/h] 


故 可 取 
D,-[Q/2) Di + /2)Di, — ВР] —1⁄4<8<o (7-61) 
当 B8 一 一 ;/4 时 ，D, 就 是 上 述 的 三 角形 中 线 。(7-61) 式 也 就 是 中 同 距 离 法 的 递 推 公式 。 
(D 重心 法 
从 物理 的 观点 看 ,一 个 类 用 它 的 重心 (该 类 样本 的 均值 向 量 ) 做 代表 比较 合理 ,类 与 类 之 间 
的 距离 就 用 重心 之 间 的 距离 来 代表 。 设 Gs 与 Go 的 重心 分 别 为 x XV 0, 与 Go 的 距离 为 
Du=dr s, (7-82) 
对 应 于 这 种 定义 的 系统 聚 类 法 叫 重 心 法 。 
设 某 一 步 将 类 G, 与 G, 合并 为 G.， 它 们 各 含有 no no nen =n, tn PRA A 
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法 的 递 推 公式 为 
Di=[G,/n) Di + lnd Ds, (п) ORD] (7-63) 
《五 ) 类 平均 法 
重心 昌 有 很 好 的 代表 性 ， 但 未 充分 利用 各 样本 的 信息 ， 有 人 建议 将 两 类 之 间 的 距离 定义 
为 这 两 类 元 素 所 有 样本 两 两 之 间 的 平均 平方 距离 ， 即 


Di (nen). «54, " (7-64) 
ЖЮ, z, fü a, 分 别 为 类 G, 与 G, 中 的 样本 数 。 айе ， 此 种 方法 的 递 推 公式 为 
DE=[ n/n „+ (n/n D° J (7-65) 


有 人 认为 类 平均 法 是 系统 聚 类 法 中 比较 好 的 方法 之 一 。 
CA) 可 变 类 平均 法 
因 在 类 平均 法 的 递 推 公式 中 没有 反映 D 的 影响 ， 故 有 人 建议 将 〈?-65) 递 推 公式 改 为 


Di=[G,/n,.)(1-- B)DO + GQi/n) 0 — EX, + BD] (7-66) 
式 中 ，8<1， 对 应 于 这 个 递 推 公式 的 系统 聚 类 法 叫做 可 变 类 平均 法 。 
(七 ) 可 变法 
如 将 上 还 讨论 的 递 推 公式 改 为 
Di-[a-8/2)0X, D + gr^, (7-67) 


RP, #<1, 那么 ， 对 应 于 这 个 递 推 公式 的 系统 聚 类 法 叫做 可 变法 。 

Sas uqa тал AAA B 的 选择 关系 极 大 ， 有 一 定 的 人 为 任意 性 ,因此 在 
实际 使 用 不 太 多 。 

CO 方差 平方 和 法 

这 个 方法 是 由 Ward HEB, BULA Ward 法 之 称 。 该 方法 的 主要 思想 是 来 源 于 方差 分 析 ， 
即 如 果 类 分 得 正确 ， 同 类 样本 的 方差 平方 和 应 当 较 小 ， 类 与 类 之 阁 的 方差 平方 和 应 当 较 大 。 

设 有 ?个 样本 拟 分 成 志 类 Go Go s Go RG, 中 的 第 i 个 样本 ， 每 个 样本 都 是 一 
Кн, п, 表示 С, 中 的 样本 个 数 , X" GG 1.2. OREO, 亦 即 该 类 的 均值 向 量 ， 
则 G, 的 样本 方差 平方 和 为 


S= > (x, — x ^ Qn, — Y?) 


* 


S= 


a, = FV, — Fo) = Ns 
Ф{ # 固定 时 ,了 选择 使 5 达到 极 小 的 分 类 。 个 样本 ,分 成 让 类 ,一 切 可 能 的 分 法 可 由 下 式 给 出 
p 


Roky = ando D | u (7-68) 


有 关 此 式 的 证 明 可 参阅 文献 [3]. LAB. HRSA RE, RAB 
是 很 困难 的 一 个 问题 ，Ward 法 给 出 的 是 一 个 局 部 最 优 解 。 其 基本 思路 为 ， 先 将 个 样本 各 自 
分 成 一 类 ， 此 时 S 最 小 然后 每 次 缩小 一 类 、 因 每 缩小 一 类 后 总 方差 平方 和 5 就 要 增 太 . Ж 
择 使 S 增 加 最 小 的 两 类 进行 合并 ， 直 至 所 有 的 样本 归 为 一 类 为 止 。 

从 上 述 讨论 中 看 ， 似 平方 差 平方 和 法 与 前 面 介 绍 的 ? 种 系统 聚 类 法 朋 较 大 的 差异 ， 其 实 
可 以 证 明 ， 方差 平 方 和 法 的 类 距离 计算 的 递 推 公式 为 
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Т = Соп, +) ID 二 ntn) 03 80 Di) an Ш, (7-69) 

工 述 所 介绍 的 8 ASABE, IRR MUP RR ce. ВЕЛ AB RS 

间 的 距离 有 不 同 的 定义 , 从 而 得 到 不 同 的 递 推 计算 公式 。Wishart 发 现 它 们 的 递 推 公式 可 以 

统一 起 来 .它们 统一 的 形式 为 

Di =a Da 480, dr DS, Р | (7-70) 

方法 不 同 ， 式 中 的 we、c、8 和 > 的 取信 也 不 同 、 表 ?7-2 SLT EXE 8 种 系统 聚 类 法 4 个 参数 

的 取 值 。 递 推 公式 的 统一 使 人 种 方法 的 共性 完全 统 - 起 来 了 ， 为 编制 计算 机 统一 程序 提供 了 
BAMA, XER [19] 给 出 了 这 样 的 程序 。 


表 7-2 系统 聚 类 法 参数 表 

方 法 a i а | B | r 
最 短 距离 法 127 | BD | 0 | -am 
BEWBHE 1⁄2 | 1? | ° | m 
PRERE 1⁄2 | 1% | -am | ° 
重心 法 п/п, | p | Gun M OD | о 
类 平均 法 пуп, | no m i DI | 0 
BY AE а-#)/% а-#)/2 i в 0 
可 变法 0-а (Pny ль | Н | 0 
方 莽 平 方 和 法 (ъл) Cn ta) (n ne) оом) | taf Gn n.) | o 
{示例 1 


现 以 -一 个 最 简单 的 例子 来 说 明 上 述 系 统 聚 类 法 的 聚 类 过 程 。 表 7-3 给 出 了 一 个 薄 层 色谱 
ЮТИЯ QW А, В, С, D. E) 分 离 4 种 物质 база, b. с. d) 的 保留 时 间 
比 移 值 AR'CRX100) 数 据 。 


38 7-3 5 个 TLC 体系 的 比 移 值 hRe 


I T 
~ ĦA | А B с 


| | 
| | 
| 100 80 | 80 | 40 
| 
| 
| | 


SAH TLC RADE, MARA A—E 诸 溶剂 中 哪些 是 相似 的 ， 哪 些 是 不 相似 的 ， 这 种 
信息 对 选择 适宜 的 溶剂 体系 进行 二 维 TLC 分 离 有 意义 。 НАЖА. З.С. р. Е АЕ 
WAS. dide 7-3 可 计算 距离 阵 ， 在 此 采用 的 是 欧 氏 距离 ， 结 果 示 于 表 7-4。 


表 7-4 TLC 溶剂 体系 的 欧 氏 配 离 


EDETI A B | c D | E 
A E ] | m 
B 40 ° | | 
с 38.7 17.3 | o | 
р] 110.4 70.7 | 78.1 о j 
E nba 21] 80.6 i1 | ә 


如 采用 最 短 距 离 法 ， 这 5 类 之 间 的 最 小 距离 为 DE, 即 局 与 是 最 相似 的 溶剂 体系 。 可 
先 将 DE 合并 为 一 类 , азу D, & 7-5 WHT DE 聚 为 一 类 厂 "后 的 欧 氏 距 离 , 从 表 7-5 可 以 
看 出 ， 当 前 类 与 类 间 最 小 的 距离 为 BC， 将 它们 再 育 为 一 类 ， 并 记 为 BT 后 的 欧 氏 距离 表示 于 
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表 7-6， 最 后 将 4 与 B' 合 并 为 一 类 4 ， 其 类 间距 离 表 泵 于 表 7-7. 
97-5 最 短 距 高 法 DE RA-ED аке 


FRE A B c n RES A + B | c D. 
A 0 I | c — 387 аа | o 
B 40 0 D: 15.4 70.7 | 78.1 


表 7-6 PHAM DE. BC W 2 BOB SEE 8 表 7-7 #ЫШЩЖАБВ W ЖЕШ КЕЩ 


溶剂 系统 A B: Dp: ERREI Ay i p 
A ° "m o ; 
B: 38.7 | 0 : 
D* 110.41 70.7 ° D 70.7 i ° 


上 述 结果 可 绘 成 谱系 图 (图 7-5)， 由 谱系 图 可 得 到 TLC 体系 的 自然 分 类 ， RM 
TLC 的 作用 机 制 有 一 定 意义 。 如 和 欲 将 溶剂 体系 分 为 两 类 ,以便 设计 一 个 二 维 TLC ЖЖ. PA PS 
类 溶剂 中 可 到 一 种 分 别 用 于 垂直 的 两 个 方向 展开 . 可 将 最 高 的 连接 线 切 断 , 即 A. В, С 是 一 
类 ，D、 鼎 是 另 一 类 。 


同 理 , 可 对 此 TLC 洲 剂 体系 用 其 他 的 系统 聚 类 的 方 


| 法 来 进行 分 析 ， 下 面 列 出 最 长 距离 法 、 重 心 法 、 方 差 平 
方 和 法 的 结果 和 娟 类 谱系 图 ， 以 便 读 者 理解 这 些 方法 的 


L | 运算 过 程 。 
图 7-5 TLC 溶剂 体系 的 最 短 对 于 最 长 力 离 法 ， 首 先 因为 这 BER 
ЖК ЖЕШ ER X DE, WDA E ESO 2658 ЛИЕ Ж. ШИ DE € 


并 为 一 类 . 000°. 8 7-8 WMT DE RAX D Jš 
的 欧 氏 距离 . AR 7-8 可 以 看 出 ， 当 前 类 与 类 间 最 小 的 距离 为 BC， 将 它们 再 聚 为 一 类 ， 并 记 
为 B' 后 的 欧 氏 距离 表示 于 表 7-9, 最 后 将 4 SB SHAK An .其 类 间距 高 表 示 于 表 7-10. 


表 7-8 最 长 距离 法 DE 聚 为 一 类 D* 后 的 欧 氏 距离 


溶剂 系统 A B c D' | 溶剂 系统 A B c D 
A о с 38.7 17.3 о 
в 40 0 | pm | nna 72.1 80.6 o 


X9 最 长 距离 法 DE, BC 聚 类 后 的 欧 代 距离 A710 最 长 距离 法 4 与 8" 桶 类 后 的 欧 氏 距离 


溶剂 系统 4 B D 溶剂 系统 | a p. 
1 
A ° At ' 0 
B: 40 0 Í 
D? 111.4 72.1 0 b Н 111.4 0 


上 述 结果 可 绘 成 谱系 图 (图 7-6), йын 4 a cp = 
离 法 是 完全 一 致 的 ， 只 是 在 类 间距 离 有 所 不 同 。 | | j 
对 于 重心 法 ,首先 也 是 将 DE 并 为 一 类 , 记 为 D"， ; | 
表 7-11 列 出 了 DE RAK DD' 后 的 欧 氏 距 高 。 

注意 到 在 表 7-11 中 ,C 点 与 新 类 DD" 间 的 距离 ,是 原 7-6 TLC 溶剂 体系 的 最 长 
CD 与 CE 间距 离 的 均值 。 豪 类 过 程 继续 进行 , 从 表 7-11 Е EL 
TUAH, HWA SARRERAN ВС, 将 它们 青豆 
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为 一 类 ， 并 记 为 8` 后 的 欧 氏 距离 表示 于 表 7-12， 最 后 将 A S BR ARH A, KÆRE 
BRM FR 7-13. 
表 7-11 BO DERA- О 后 的 欧 氏 距 高 


溶剂 系统 | A | в Тос | D mange loa Í s c Í p: 

A Гоо | 77 "m 38.7 17.3 0 | 7 

в | a | o | D 109 | 714 79.3 | ш 
表 7-12 重心 法 DE. BC Ж hR S ER #713 BOKAS B 838 P BJ EK S BE 8 
Р А a p wae | x D. 

4 0 ^ " с 

B 393 0 

D 110.9 75.3 o p 551 5 


LEAR RRA 〈 图 7-?)， 此 结果 与 前 述 方 法 也 是 完全 MH. 

方差 平方 和 法 的 步骤 与 上 述 方法 略 有 不 同 ,其 过 程 如 F， 4 g c p к 
首先 将 AL В, С, D, ЕПН 5 Ж, HM BW S=0. f L 
后 将 其 中 任意 两 类 合并 ,并 计算 它们 合并 后 的 方差 平方 和 , 例 | | 
如 将 有 4、5 合并， 所 得 的 方差 平方 和 为 


Sa = MGas—x "You, — Ж) (тту МТ TLC 溶剂 体 系 的 
а Жоктан 
式 中 
(100-++80)/2, £90) 


(80+50)/2 70 


A 


(70+50)/2 | :60| 

(60+40)/2 J 50! 
| M 
_ |80 _ 160 
Хан "| Хаво 50 
60 40 


Su 一 400 十 400 一 800 
如 将 B、C 合并 ,所 得 Sse 二 150, 一 切 可 能 两 两 并 类 增加 的 方 养 平方 和 列 于 表 7-14, 以 ED 合 
3t S 增加 最 少 , 故 可 将 它们 合并 ,然后 , 再 计算 ED 与 其 他 未 并 类 的 A. B. C 进行 并 类 , 发 
现 所 增加 的 方差 较 多 , 而 将 BC 并 类 使 方差 增加 较 少 , 故 可 先 将 BC 并 类 , 然后 再 考虑 所 有 可 
能 的 并 类 , 重复 上 述 步骤 , 直至 所 有 样本 归 为 一 类 为 止 。 对 TLC 溶剂 体系 的 方差 平方 和 法 并 
类 情况 示 于 表 7-15, 它 很 类 似 于 其 他 系统 聚 类 的 方法 ， 所 得 结果 也 相同 , 从 上 述 讨论 可 知 , 在 
此 介绍 的 8 种 系统 聚 类 方法 的 确 具有 一 定 共性 的 。 
R714 两 商 并 类 后 S 的 增加 星 
TRES Sax Sox 


Sex Sox Sex 


monwa 
z 
z 
2 


表 7-15 TLC 溶剂 体系 的 方差 平方 和 法 并 类 情况 


分 类 数 日 类 5 分 类 数 晶 * B 
5 A. B,C D, E G z ABC, DE 1233.3 
4 A, B. С, DE 106 1 t ABCDE ingen 
3 А, BC, DE 250 
二 、 一 分 为 二 法 


系统 聚 类 是 将 类 由 多 到 少 ， 另 一 种 分 类 的 思想 是 分 解法 ， 则 是 使 类 击 少 到 多 ， 开 始 全 体 
样本 全 为 一 类 ， 然 后 分 成 两 类 、 三 类 ，… 直 至 所 有 的 样本 各 入 成 一 类 。 一 分 为 二 法 就 是 这 样 
一 种 分 解 方 法 。 

【基本 思路 】 

一 分 为 二 法 是 将 某 一 类 分 解 成 为 两 子 类 的 方法 ， 然 后 对 其 子 类 又 可 一 分 为 二 。 其 基本 思 
路 是 在 不 断 的 分 解 过 程 中 ， 使 得 羔 间 方 益 保持 最 大 。 如 设 某 类 G 中 有 ТЕЖ, CMT E 
类 Gl 和 Gs 各 有 zn, 和 ws 个 样本 , 两 类 的 重心 , 即 均 值 向 量 分 别 为 . x0 x0, 而 类 的 重心 
AX, WEG. GAG, 的 方差 平方 和 分 别 为 


S= Ma, — Xr — X) 


EUM 
S, = MG, E Qu, — XU) — = 1.2 
a 


ER xe Gm Za mln ARAMA, S. S, WS, 分 别 为 类 G HEMT TAC, 和 
G, 的 方差 平方 和 。 如 果 类 分 解 得 合理 ， 应 使 S, 一 S: RRM). RECS- S SARTRE 
К.з E= (5-— 5,—5:), M E ДН -分 为 二 的 分 解 过 程 中 的 日 慰 函 数 , 根据 方 共 分 解 定理 ， 
可 得 
E-(G—8, 8) = [Gua WEY 0090 
或 者 
E-45—8,—8) = Гот) nm] x» EP —m 

如 类 GG 中 有 个 样本 , 则 一 切 可 能 的 分 法 有 ?一 1 种 . 是 一 个 组 合 优化 问题 ,一般 说 米 ， 
求全 局 最 优 比较 本 难 ， 一 般 是 求 得 一 个 局 部 最 优 解 ， 

【基本 算法 】 

在 此 ,介绍 一 种 局 部 最 优 解 的 算法 ， 它 由 下 述 步 双 组 成 : 

OD 首先 将 二 个 样本 都 认 作 为 类 G 的, 依次 从 中 取 一 个 样本 , 将 
目标 函数 E, 

(2) 比较 依次 计算 所 得 的 a 个 已 ， 并 从 中 找到 最 大 者 ， 记 为 EC1) ， 作 为 一 次 成 功 分 解 。 

CD 继续 分 解 ， 即 从 类 С, 所 剩 QD 样本 中 再 到 一 个 样本 划 人 G:， 并 计算 此 时 的 目标 
函数 已 ， 比 较 依次 计算 所 得 的 (na 一 1》 个 ,并 从 中 找到 最 大 者 , 记 为 2 (2)， 认 作 一 次 成 功 
分 解 。 重 复 此 过 程 , 可 得 一 系列 最 大 的 EE, 记 为 上 (3) EGO ECR), 它们 分 别 表示 在 G: 中 
会 2 个 样本 、3 DEE, e. k PERRA E M 

Co 找到 一 个 自然 数 4 ， 使 得 

E(k )=moxE(R) — (4e 
(5) BR UREA G, 的 样本 为 一 类 ,其余 (x 一 &* ) 个 样本 为 一 类 ， 一 分 为 二 的 分 解 完毕 。 


MA C:， 计 算 此 时 的 
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(6) 继续 对 所 得 的 GAG. 进行 一 分 为 二 的 分 解 ， 直 至 所 有 的 4 个 样本 独自 成 为 ~ 类 
为 止 。 

一 分 为 二 法 不 需 大 量 内 存 , 计算 量 也 不 大 , 因此 是 一 种 较 好 的 聚 类 分 法 。 值 得 提出 的 是 ， 
上 述 一 分 为 二 法 是 利用 类 间 方 差 极 大 为 其 日 标 函 数 ， 用 其 他 日 标 晴 数 也 是 可 行 的 。 文献 
[22] 就 介绍 了 . -种 基于 网 氏 距 离 的 一 分 为 二 的 分 解法 。 


三 、 最 小 生成 树 法 


【基本 概念 与 基本 思路 】 
最 小 生成 树 (Minimal Spanning Tree Method, MST) АФ. 
进行 说 类 计算 。 在 介绍 最 小 生成 酉 方法 之 前 ， 似 有 必 赣 介绍 一 下 有 关 图 论 和 树 的 基本 概念 


图 由 结 点 的 集合 V qudd d E s 
VS (OTU Unt n 为 结 点 的 数目 
E= eee, em? m 为 边 的 数目 


ВДИ С прл у 
С= (У.Е: 

&—Л Щй 80 2 W PT Br F О ВС t НЕЕ, A, WA] 
通过 一 系列 的 边 联系 起 来 , 这 些 边 称 作 链 , 一 个 链 如 果 是 封闭 的 则 称 这 个 链 组 成 一 个 回路 , 如 
Ena 个 点 之 间 都 有 链 互 相 联结 ， 则 称 这 些 点 和 链 组 成 了 - -个 联结 图 ， 没 有 回路 的 联结 图 叫做 
树 。 如 果树 包含 了 个 点 ， 则 称 这 个 树 为 联结 图 的 支撑 树 ， 树 的 所 有 边 的 长 度 之 和 叫做 树 的 
重量 。 在 联结 图 中 具有 景 轻重 量 的 支撑 树 叫 做 最 小 生成 树 ， 亦 称 最 小 支撑 树 。 

最 小 生成 鱼 可 按 Kruskal 算法 找 出 , 这 个 算法 上 分 简单 ， 要求 将 权 值 最 小 的 边 绘 人 树 中 ， 
但 不 得 与 已 有 的 边 形成 回路 。 

【基本 算法 】 

CD 先 计算 各 点 同 的 距离 ， 

Q 连接 最 小 距离 的 两 点 ， 然 后 连接 次 小 听 离 的 两 点 ; 

加 继续 连接 所 剩 下 点 的 最 小 工 离 的 两 点 , 并 检查 是 否 形成 回路 , 如 形成 回路 则 取消 连接 ， 
否则 ， 继 续 连接 ， 直 至 所 有 的 点 都 被 连接 

@) 对 连接 所 得 的 树 进行 检查 , 找到 最 大 距离 的 边 , 将 其 割断 , 即 得 两 类 , 如 此 继续 分 割 ， 
直至 类 数 已 达到 所 要 分 的 类 数 。 

如 对 前 述 的 TLC 溶剂 体系 进行 最 小 生成 树 分 类 , 可 得 与 系统 案 类 法 完全 一 致 的 结果 。 Ж 
献 [3] 对 系统 皮 类 法 中 的 最 小 路 离 法 与 最 小 生成 树 的 关系 进行 了 较 详细 的 讨论 , HUEN T Ж 
短 距 离 法 是 在 由 最 小 生成 树 为 基点 而 定义 的 误差 函数 下 的 最 合理 的 育 类 方法 。 


Щщ, к-н 


FERRE TERIS FÉ — EU] А. ASS SRA E f RR) IUE ВЕН НЕНА, 此 
外 ， 系 统 聚 类 法 一 般 要 存 人 距离 年 阵 ， 当 ” 较 大 时 占用 的 内 存 太 多 。 计 算 方法 的 选 代 思想 给 
我 们 以 启发 ， 能 否 先 给 一 个 粗 烽 的 初始 分 类 ,然后 用 某 种 原则 进行 修改 ， 直 至 分 类 比较 合理 
为 止 。 采 用 这 种 思想 产生 的 豪 类 分 析 法 叫做 动态 聚 类 法 。 为 了 得 到 初始 分 类 ， 有 时 设法 选择 
一 些 凝 聚 点 ， 让 样品 按 基 种 原则 向 凝聚 点 凝聚 ， 动 态 聚 类 法 大 体 可 用 图 7-8 的 框图 表示 。 
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f ` ва 


RARE | 一 一 一 | 初始 分 类 


图 ?7-8 动态 聚 类 法 程序 框图 


图 7 8 的 每 一 部 分 构成 均 有 很 多 种 方法 ， 这 些 方 法 按 框图 进行 组 合 就 可 得 到 很 多 种 动态 
RISK. 在 本 节 只 讨论 其 中 一 种 , ИШ 天 -均值 聚 类 法 (天 -means Cluster Method). 它 是 一 种 用 
得 较 多 的 方法 .该 法 最 早 是 由 MacQueen- 护 提出， 随后 许多 人 对 此 作 了 改进 。 

【基本 思路 】 

区- 均 俏 聚 类 法 的 基本 思路 是 先 人 为 地 定 出 一 个 分 类 数目 4， 并 任 皮 “个 点 作为 初始 凝聚 
点 ， 然 后， 逐个 将 别 的 样本 引 人 , 引进 -个 样本 就 计算 它 与 个 类 的 距离 (与 重心 的 距离 ), 选 
定 距 离 最 小 者 将 其 并 人 该 类 ， 再 重新 计算 各 类 的 重心 ， 并 以 该 重心 作为 新 的 凝聚 点 ， 直 至 每 
个 样本 都 有 了 各 自 的 归 类 。 

【基本 算法 】 

OD 最 简单 的 玉 - 均 值 聚 类 法 的 计算 过 程 

(D 人 为 地 定 出 一 个 分 类 数 日 、 取 前 不 个 点 作为 初始 凝聚 点 。 

@ 将 剩余 的 (na 一 4) 个 样本 逐个 引入 ， 并 计算 它 与 已 有 《 个 类 的 距离 〈 与 重心 的 距离 ) 
选 定 距离 最 小 者 ， 则 将 其 并 入 该 类 .再 重新 计算 各 类 的 重心 ， 并 以 该 重心 作为 新 的 凝聚 点 。 

Э Hn 个 样本 再 从 头 至 包 逐 个 输入， 再 计算 它 与 已 有 个 类 的 重心 的 距离 ， 并 选 定 距离 
最 小 者 ， 则 将 其 并 人 该 类 ， 再 重新 计算 各 类 的 重心 ， 并 以 该 重心 作为 新 的 凝聚 点 。 如 果 n 个 
样本 通过 后 所 分 的 类 与 原来 的 类 没有 改变 ， 则 过 程 停 止 ， 否 则 重复 第 久 步 。 

从 上 述 计算 过 程 可 以 看 出 ， 此 算法 计算 简单 ， 分 类 迅速 ， 占 用 计算 机 内 存 小 ， 但 由 于 人 
为 地 定 了 上 个 类 ,有 了 时 定 得 不 合适 而 影响 分 类 效果 ,改进 的 办 法 是 在 修改 分 类 的 过 程 中 类 的 数 
目 也 可 以 根据 情况 有 所 变化 ， 太 近 的 类 可 以 合并 ， 太 远 的 类 可 以 分 离 出 来 产生 新 类 。 下 面 和 将 
给 出 改进 后 的 下 -均值 来 类 算法 。 

(2) 改进 的 KK- 均值 紊 类 法 的 计算 过 程 

中 入 为 地 定 出 三 个 数目 、c flr, 

@ 取 前 个 点 作为 初始 凝聚 点 , 计算 个 凝聚 点 两 两 之 间 的 距离 ,如 最 小 距离 之 ce, 则 将 
相应 的 两 凝聚 点 合并 ,用 这 两 点 的 重心 作为 新 凝 素 点 ， 重 复 此 步骤 ,直译 所 有 凝 取 点 之 间 的 
路 离 均 大 于 等 于 c 为 止 。 换言之 ， 即 要 使 肯 聚 点 两 两 之 间 的 距离 均 大 于 等 于 <， 如 小 于 W 
用 系统 聚 类 法 中 的 重心 法 将 凝聚 点 进行 合并 。 

@ 将 剩余 的 a-b 个 样本 逐个 引 人 ， 再 计算 它 与 已 有 个 凝 认 点 的 距离 ， 如 最 小 距 
离 >r， 则 该 样本 作为 新 的 凝聚 点 ; 选 定 上 距离 最 小 者 ， 则 将 其 并 人 最 靠近 该 样本 的 凝聚 点 . 再 
重新 计算 各 类 的 重心 ， 并 以 该 重心 作为 新 的 凝聚 点 。 重 新 验证 新 凝聚 点 两 两 之 问 的 蝶 离 . 如 
距离 一 c， 则 将 相应 的 两 凝聚 点 合并 ， 用 这 两 点 的 重心 作为 新 此 聚 点 ， 重 复 此 步骤 ， 直 至 所 有 
ИНОЕ ЮК ТРЕ с. 

(D ПЕЕ AREA, НООМАН, {Н РОК. 不 同 
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之 处 在 于 : 某 个 样本 进入 后 , 如 分 类 与 原来 的 一 样 ， 则 重心 不 变 ; 如 分 类 与 原来 的 不 一 样 ， 则 
所 涉及 的 两 类 重心 需 重新 计算 。 如 果 ”个 样本 通过 后 所 分 的 类 与 原来 的 类 没有 改变 ， 则 过 程 
停止 ， 否则 重复 第 名 步 。 

由 于 下 述 天 -均值 聚 类 法 的 分 类 结果 仍 有 很 大 的 不 确定 性 ， 促 使 人 们 设法 对 它们 进行 改 
进 , 有 关 的 研究 也 很 多 , 其 中 以 Isodata 命名 的 方法 是 这 一 类 方法 中 最 精细 的 一 个 , 它 是 美国 
标准 研究 所 花 了 好 几 年 的 时 间 研 究 出 来 的 "此外, 用 全 局 最 优化 方法 来 改进 天 -均值 聚 类 法 
是 目前 化 学 计量 学 研究 中 的 一 个 重要 课题 ， 将 在 后 述 章节 加 以 适当 介绍 。 


五 、 基 于 全 局 寻 优 的 聚 类 法 


【基本 思路 ] 

从 前 述 讨论 可 知 ， 桶 类 分 析 实 际 上 可 看 成 一 个 优化 过 程 ， 它 通过 优化 某 一 特定 的 目标 本 
数 市 达到 最 好 的 分 类 。 由 于 诊 类 目标 冰 数 的 严重 非 线性 ， 用 传统 的 局 部 优化 方法 难以 找到 全 
局 最 优 解 ， 因 此 和 需 用 全 局 优化 方法 。 对 于 n 个 样本 划分 为 < 类 的 问题 ， 可 能 的 组 合 划分 数目 
жх, 

= | (7-72) 

若 将 100 个 样本 分 为 两 类 ， 册 穷 举 法 需 计 算 高 达 2” 一 1 种 划分 ， 以 确定 最 优 解 ， 且 用 其 
他 确定 性 的 全 局 优化 方法 也 因 计算 晤 过 大 而 难以 实现 。 随 机 性 的 全 局 优化 方法 在 处 理 上 述 问 
题 上 优 于 确定 性 全 局 优化 方法 ， 遗 传 算法 和 模拟 退火 作为 随机 性 的 全 局 优化 方法 已 开始 引入 
化 学 素 类 分 析 ?+， 它 们 的 共同 之 处 是 将 素 类 分 析 构 造成 站 连续 的 组 合 优化 问题 ， 即 通过 寻 
找 各 个 样本 对 各 类 的 划分 而 求 得 最 优 目标 畏 数 , 由 (7-42) 式 可 知 此 类 方法 计算 量 巨大 , 需 消 
耗 委 长 时 间 才 能 找到 最 优点 。 在 此 讨论 的 是 连续 型 优化 模型 ， 即 通过 莽 出 各 类 中 心 的 正确 位 
惫 而 达到 正确 衰 类 ， 使 所 有 点 到 其 所 属 类 中 心 距离 的 和 最 小 ， 避 兔 了 求解 组 合 优化 问题 、 从 
而 碱 少 了 计算 量 ， 提 高 优化 效率 。 遗 传 策略 :2 被 用 干 在 连续 的 实数 空间 寻 优 ， 此 法 是 一 种 借 
鉴 生物 界 自然 选择 和 自然 遗传 机 制 的 随机 搜索 优化 策略 ， 并 隐 含 并 行 性 和 对 全 局 信息 的 有 效 
条 用 能 力 是 其 两 大 特点 ,前 者 使 遵 传 第 法 只 须 检测 少量 的 结构 就 能 反映 搜索 空间 的 大 量 区 域 . 
后 者 使 遗传 算法 具有 稳健 性 〈 即 不 会 收敛 至 局 部 最 优 ), 故 它 尤其 适 于 处 理 传统 搜索 方法 解决 
不 了 的 复杂 和 非 线性 问题 (参见 第 四 章 )。 在 此 ， 以 遗传 算法 为 例 来 说 明 臣 于 全 局 寻 优 的 入 类 
法 ,当然 , 其 他 全 局 最 优 方法 , 如 模拟 退火 [5 和 基于 数论 的 序 贯 优化 算法 也 同样 是 可 行 的 ， 因 
它们 的 基本 原理 是 类 似 的 。 

遗传 算法 通过 模拟 生物 的 遗传 、 变 异 和 自然 选择 过 程 , 将 一 代 群 体 变换 到 新 一 代 的 群体 。 
在 这 里 每 代 群 体 由 一 组 染色 体 组 成 每 条 染色 体 代表 搜索 空间 内 的 1 个 解 。 染 色 体 由 待 求 参 
数 排列 在 一 起 构成 。 通过 对 上 一 代 《〈 父 代 ) 群体 中 的 染色 体 进行 有 选择 的 复制 、 交 叉 和 变异 ， 
可 产生 新 一 代 ( 子 代 ) 群体 , 此 过 程 一 直 重 复 , 直至 达到 最 优 解 。 通 用 做 法 可 简单 描述 如 下 。 

CD 染色 体 表示 ,给 出 搜索 空间 中 染色 体 的 表示 形式 ,将 待 求 参 数 的 一 组 取信 排列 一 处 , 构 
成 一 个 串 ， 此 即 一 条 染色 体 ， 它 代表 所 求 问题 的 一 个 可 行 解 。 

O 群体 初始 化 。 选 择 一 个 整数 作为 群体 的 规模 参数 ， 然 后 在 搜索 空间 内 随机 地 任 取 
个 点 ， 每 个 点 用 一 条 染色 体 表示 ， 这 些 染色 体 构成 初始 群体 。 

© 计算 目标 函数 值 。 将 每 条 染色 体 上 的 参数 取 值 代 人 所 求 的 月 标 函 数 中 ,计算 出 对 应 的 
目标 函数 值 下。 
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OD RE. HA RAR TULARE, 将 其 转换 
成 适合 的 值 . RTC RISE «OR Ae RO, БН PAR @ Ж 
适应 性 大 ， 故 采取 如 下 转换 
fittness(¢)={max(F)—F()]/"max(F)—min(F)] (7-73) 
© 根据 适应 性 大 小 ， 设 计 一 个 随机 选择 规则 . 复制 出 下 一 代 群 体 。 本 文采 用 赌 盘 选 择 技 
Ж. 此 选择 过 程 虽 是 随机 的 ， 但 每 个 染色 体 被 选择 复制 的 机 会 却 直接 与 其 适应 性 成 正比 。 
© 交叉 和 变异 。 交 叉 是 以 概率 P. 交换 珂 条 染色 体 问 对 应 位 置 上 的 分 盟 。 变 异 是 以 概率 
改变 染色 体 上 的 每 一 位 的 值 。 本 文通 过 如 下 方式 实现 ， 
ze = 265 Х (гапа) (7 74) 
在 此 ，rand 为 (0,1) 均 勾 分 布 的 随机 数 。 
整个 优化 过 程 通过 第 3 步 至 第 6 之 间 的 循环 进行 实现 。 日 标 函 数 收 敛 后 停止 。 
在 此 介绍 的 方法 是 基于 前 述 天 -均值 聚 类 法 的 一 种 方法 , 首先 确定 名 类 中 心 , 然后 根据 样 
本 点 与 各 中 心 的 距离 进行 分 类 。 因 此 梅 造 的 呈 标 函数 依赖 于 各 类 的 中 心 。 遗 传 算法 用 来 搜索 
正确 的 类 中 心 ， 若 样本 空间 为 p Е, 共 分 ¢ Ж. WERE рс 个 实 参 数值 。 对 于 不 同 的 方 
法 ,目标 函数 的 构造 过 程 不 一 样 。 可 分 别 描述 如 下 : 


设 样 本 数据 矩阵 可 表示 为 
(7-75) 
202 iL 
其 中 ,x 为 样本 点 数 ，p 为 样本 维 数 。 各 类 中 心 可 表示 为 
[оошо] |? 
0305710, jo 
0— =! i (7-76) 
9504 Li 
5 为 类 数目 ， 为 样本 向 量 的 维 数 。 优 化 的 目标 是 使 式 (7-77) 所 示 函 数 达 到 最 小 ， 
minimizeF(W,0) = > Уло) (7-77) 


AP, We (оу сха 的 权重 矩阵 ; Sw, =1,w, € 10,11. Рб,,0,) 98) MEARS i 
个 中 心 之 癌 的 欧 氏 距离 ， 即 


[f 
DG,6)=,J MG, -oo (7-78) 
A 


A, Обу, DAR 7 个 样本 点 到 第 ; 个 中 心 之 间 的 距离 ， 昌 minl) Ko; max (v) G=1, 
Ci)。 苦 印 "、0 为 最 优 的 权重 和 类 中 心 矩阵 ， 对 于 上 述 问题 可 从 两 
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个 方面 进行 优化 : ИЮ Ww. REREH FW, 0) 值 ; 二 是 寻找 最 优 的 0 ， 
以 求 得 最 优 的 下 ОУ, O`) 值 。 前 一 方法 为 非 连续 的 组 合 优化 问题 。 后 一 方法 为 连续 的 优化 
问题， 其 实质 是 在 p 维 的 实数 空间 内 搜索 出 < 个 点 〔 威 优 类 中 心 )。 

【基本 算法 】 

FRERE 个 类 中 心 的 一 组 取 法 、 HS EOS: cH), KP 
d—pXc. р 为 样本 维 数 ,* 为 类 的 数目 。 

O 将 每 条 桨 色 体 向 量 转变 为 -. 个 类 中 心算 阵 ， 其 每 个 元 素 的 可 由 07-79) 式 确定 : 

Qum Fes pee QS Tex р) (7-79) 

(D 根据 (7-78) RSE REAR vis vo се. >, 与 各 个 中 心 o 的 欧 开 距离 ,将 每 个 样本 划分 
SRR RIM, BREW. 

(3) 根据 W ADV RTA PD ol, EM 


Ses, 
o=* - (7-80) 


>=, 


= 


(4) 根据 (7-77) RUS BRA. 


O 将 新 的 类 中 心 转化 为 染色 体 ， 根 据 相应 的 五 对 其 进行 评价 和 遗传 操作 ， 然 后 转 第 1 
步 ， ЕНЖЕЛ. 
【讨论 】 


用 本 算法 对 两 组 分 析 数 据 进行 了 聚 类 分 析 : D 13 种 牛黄 样品 中 微量 元 素 含量 ,经 标准 
化 处 理 后 的 数据 列 于 表 1-16; © Жж LAA 。 
表 7-16 经 标准 化 处 理 后 的 13 种 牛黄 样品 中 微量 元 素 含 是 


BEL с cu Mn Ti Zn Ph Mo са к Na P 


1 2601 1.2863 —0.3583 —0. 8806 2.1462 0.7075 0.3092 2.1408 -0.8782 - 0.7993 
2 |--0.5501 — 0.4793 — 0.4264 —0.7349 1.6573 0.9897 0.3092 1.1206 —0.9712 —0. 8503 
3 |-—0.2094 1.4416 1.3222 —0, 9609 1.3797 0.2796 1.8713 0.7906 —0. 7823 —U. 7128 一 

4 |—0.1412 —0.7887 — 0,3329 —0.9448 —0. 4879 — 2.3681 0.8089 一 0.3985 0.4146 

5 |—9.0325 0.3860 0.9965 — 8966 —0. 3549 — 0.5646 —0 6738 -M4288 0,7528 1.2399 — 9.4790 
6 0.4039 —0.1633 0.3890 — 2,2495 —0. 4589 -0.6124 一 0.9546 0.0439 1.3284 0.6620 —0. 3356 
了 

8 

9 


—0.8455 1.6040 —0.8126 —2.2655 —0.5768 —0. 0425 1.1693 —U 5755 —0.2066 0.3871 —0. 6435 
—0. 5539 —0.9086 —0.7482 0,0371 - 0.4448 -0.0360 0.5334 —0.8322 1.7122 1.9544 —0. 4382 
—0.5880 —0, 6811 —0.4788 1.6784 —0. 5340 —1.0765 —0, 9546 —0.4471 1.0406 —0. 7953 
10 11.5648 一 0.7780 —1.0007 一 0.4273 —0. 5804 —0.3776 — 0.1121 ~0/8505 0.8487 0.6620 - 
п | 0.0178 0.9968 —0.9148 0.6422 —0.5779 —0. 4834 1.5906 -0.4838 0.3028 0.1671 
12 | 25199 一 0.8352 —0.6767 1.9193 —0. 5841 —1. 1460 0.9516 ~0.658C —].1680 -1.4827 
13 | 14905 - 1.0822 2.2487 0.8831 一 5833 —1.1408 — 0 9546 -0.8413 —0.0742 — 0.8308 


DRE. 1 一 3 为 自然 生成 牛黄 ，4 一 13 为 人 工 培养 牛黄 。 

在 进行 聚 类 分 析 采 用 的 遗传 算法 中 ， 父 代 群 体 规模 为 20， 通 过 复制 、 交 叉 和 变异 后 产生 
80 4 FE EIR, BLA Pi 20 条 好 的 ， 作 为 新 的 父 代 。 其 中 交叉 概率 为 0.7, 变异 概率 为 
0.2。 对 各 套数 据 分 类 结果 讨论 如 下 ， 

牛黄 是 一 种 常用 中 药 ， 分 为 天 然 的 和 人 工 的 、 dox 7-16 列 出 的 13 个 样本 中 ，1 一 3 号 为 
天 然 牛 黄 ，4~13 号 为 人 工 牛 黄 。 对 此 数据 采用 遗传 法 计算 ， 均 能 在 十 代 之 内 得 出 最 优 结果 : 
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1 一 4 号 为 第 一 类 ，5 一 13 SHO, НИ Е = 04. 2989， 优 于 文献 [24] 用 
模拟 退火 求 得 的 结果 (F* 一 94. 3589, 第 7 号 样本 被 误 分 至 第 一 类 )。 值 得 提出 的 是 ， 若 将 第 
4 号 按 愿 数据 分 类 划 为 第 二 类 上 时， 日 标 函数 值 将 增 大 至 95. 2626， 似 不 太 合理 。 

茶叶 是 一 种 消耗 量 很 大 的 商品 ， 贝 于 产地 、 加 工 方式 等 不 同 ， 故 种 类 较 多 ,质量 不 一 ， 
Liu FACS OTT 31 种 茶叶 , 其 中 包括 三 类 : 绿茶 、 黑 茶 和 乌龙茶 , 每 类 中 又 各 含 两 种 . 根 
据 茶叶 专家 品 偿 结果 将 各 种 茶 标号 ， 最 好 的 计 为 1 导 。 对 此 分 析 数 据 采用 谱系 聚 类 方法 进行 
了 分 类 。 他 们 的 结果 可 概括 为 

第 一 类 ; C.—C,, H,—H,, K,—K,, F,—F, 

第 二 类 ; C.—C,, HoeHs KK. F,—F; 

第 三 类 ; TT. S,—S, 
根据 此 结果 ， 可 求 得 目标 函数 值 FD 50. 8600。 

采用 本 文 所 述 分 类 方法 结果 为 

第 一 类 ; CoCo HH K- FoF, 

第 二 类 : GC, Hi~Hy, K,—K,, PF;~F; 

BIX: TOT, S,—S, 
得 目标 函数 值 R 为 50.6999。 结 果 与 文献 [24] 中 一 致 ， 且 最 长 可 在 10min LEU RE 
点 ， 从 速度 上 看 明显 优 于 文献 [24] 中 的 模拟 退火 方法 (E 68min), 

对 上 述 两 类 实际 体系 的 分 析 表 明 ， 用 遗传 算法 进行 聚 类 分 析 ， 在 连续 的 实数 空间 中 寻找 
最 优 的 各 类 中 心 ， 计 算 量 比 非 连续 的 组 合 优化 小 ， 分 类 合理 ， 是 一 .种 有 效 的 无 监督 模式 识别 
方法 。 


A. BOE 


ERRARE P] ЖЕЕ ЗО И Ар Д ТИЕ A, RR RS 
个 样本 将 绝对 地 划 归 某 一 类 , 即 每 个 样本 仅 能 属于 一 个 类 ;而 模糊 分 类 的 结果 是 每 个 样本 可 在 
不 同 程度 上 或 多 或 少 地 属于 各 个 不 同 的 类 。 文 献 [24,25] 中 所 用 分 类 方法 均 属 硬 分 类 。 模 糊 
分 类 方法 在 分 析 化 学 文献 中 少见 , HoriaF. Pop 等 人 :最近 在 这 方面 作 了 有 益 尝试 , 但 他 采用 
的 是 用 局 部 优化 方法 进行 谱系 素 类 。 在 此 , 我 们 将 介绍 用 遗传 算法 来 进行 借 糊 分 类 中 的 方法 。 

【基本 思路 ] 

模糊 分 类 是 根据 Bezdek-? 提 出 的 方法 ， 如 仍 采 用 前 节 所 定义 的 符 导 , 则 模糊 分 类 与 前 节 
不 同 之 点 仅 在 于 权重 阵 W， 对 于 硬 分 类 权重 阵 W 的 元 素 只 能 取 1 或 0， 面 模糊 分 类 中 的 权重 
阵 外 的 取 什 可 在 《0, 1) 连续 变化 . 它 也 是 从 初始 模糊 权重 阵 W 或 类 中 心 阵 O 开始 , 用 下 述 
PRUETT AK, 


(7-81) 


(7-82) 


ORW rP S — 4, 即 可 利用 上 述 两 式 来 相互 求 另 一 个 . 若 先 求 W^ 需 计 算 cXn 个 参数 , 若 
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ERO, ЖУЙ OX p DBA. A-RA рп, OR 0 计算 量 小 些 。 因此 本 文 是 求 最 优 的 类 
dub 007) 以 使 目标 晃 数 达到 最 小 ， 直 至 达到 某 一 收 伍 准 则 (如 上 We wn | <), 
【基本 算法 】 
具体 算法 可 表示 如 下 ， 


目标 钞 数 为 ”minimizeF (W ,Q) = У) Nae DG, v) (7-83) 


= 1 


W 为 cXn 的 模糊 权重 阵 。 其 中 ууш, = 150, € 70,1] ,在 此 权重 可 在 [0，1] KEERI 


E 而 硬 分 类 权重 只 可 取 0 或 1。 ARHAR DG, 00 = ү IS — o0! ИВ DOS 00 
继 用 下 述 (7-84) 5 (7-85) 两 式 计算 新 的 类 中 心 和 权重 ， _ 


o= — n (7-84) 


w, = L Doa? ко? (7-83) 
> Bowes! 

寻找 最 优 的 ORW ЖЕЕ НКИ, RIO Rw rh e. BEAD HAA O h-- 
来 求 另 一 个 。 车 先 求 W'. HHH Xx TER, FARO, BHA Xp 个 参数 。 因 一 般 有 
pn. 故 求 0' 计 算 量 小 些 。 遗传 算法 用 来 优化 的 过 程 基本 与 硬 分 类 同 , 只 是 计算 权重 、 类 
中 心 是 利用 上 述 (7-84) 5 (7-85) MR- 

【讨论 】 

用 本 算法 对 两 组 分 析 数 据 进 行 了 育 类 分 析 ; 中 两 类 烟叶 化 学 成 分 分 析 结 果 -"; © 古 罗马 
陶器 碎片 中 几 种 主要 和 次 要 无 机 成 分 售 量 数据 ( 表 11077, 

烟草 的 品种 与 其 化 学 成 分 之 间 的 关系 密切 , 由 于 化 学 成 分 数目 较 多 , 在 此 采用 了 26 种 烟 
的 16 种 主要 成 分 。 其 中 第 1~13 SRA, 0 14—26 号 为 烽烟 。 用 本 文 所 述 模糊 聚 类 分 
类 方法 分 析 , 结果 为 第 2~13 号 为 一 类 ,第 1、 第 14~26 号 为 第 二 类 , 目标 函数 值 为 8. 8930X 
10°, 第 1 号 对 第 一 类 的 权重 为 0. 2987, 对 第 二 类 的 为 0.7013, 若 将 其 分 别 改 为 0.51 和 0.49， 
Hina Bot EJES 8. 9732X10;， 可 见 第 1 号 应 分 至 第 二 类 ， 


表 7-17 古 罗 马 陶 器 三 片 中 几 种 主要 和 次 要 无 机 成 分 含量 数据 


试 =* | Кк MgO сао то, Мао Fe;O; ALO; 
02A 2.08 3.38 & 63 dj o 9.08 6.16 17.40 
028 1.88 3.33 9.52 0. 93 0.13 7.07 18. 20 
02 2.08 3.40 8.31 5.91 0.14 7.03 19.80 
02D 1.84 3.17 9.99 2.95 0.15 2.32 18.80 
03 | 2.54 1.37 11.50 0.82 0.11 5.18 23.10 
05А 3.15 8.00 1.85 0,92 0.14 8.88 19.10 
OSB 3.13 8.45 1.81 6.91 0.14 9.12 20.00 
osc 2.77 7.67 1.71 0. 89 0.11 8.84 19.10 
OSE 2.96 3.80 1.69 0. 88 0.12 9.24 19.60 
он 1.72 1.45 1.02 1.40 0.01 6.58 18. 60 


3.04 1.84 3.31 1.07 0. 09 7.14 20. 80 
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BR 
щщ 样 K,0 Mg) Cad Tio. MnO Fez0; ЛО 
B oA 3.06 4.79 1.48 DR $18 9.32 21.95 
oB 3.03 2.00 3 0.06 5.00 25.30 
oec 1.98 3.51 On 7.30 18.40 
08 2.61 3.08 9.16 7.92 
09A 1.96 3.57 LT 7.48 
3.61 4.63 oH 8.60 
ос 2.24 108 0.09 6.81 
LOA 1.93 1.38 T 3.32 25.50 
10B 1.88 Lt 8.21 25.10 
ПА 2.75 1.34 5.67 20.80 
11B 2.B6 2.10 10.90 1.28 0.08 6.05 23. 30 
12A 2.26 1.27 10.60 0.95 4. 19.20 
12B Í 2.88 2.02 11.50 w D DE 22.20 
13A MET: 35.32 1.78 DE 0.15 8.9 19.80 
L3B ! 1.76 3.26 12.30 0.88 0.14 6.01 17.30 
ис 2.18 3.40 9.73 D 0.08 6.19 15.06 
13D 2.40 3.37 9.00 ч 0.16 7.39 17.40 
13E 1.92 3.22 12.50 7.76 17.00 
13F 2.02 3.21 11.10 7.18 17. 36 
ис 2.92 1.19 12.80 5.37 
ME 3.20 1.94 8.71 5.76 
15A 3.19 2.01 12.30 8.80 
15В 3.06 1.78 9.53 6.62 20. 
18А 3.18 8.08 1.78 9.22 19.20 
16B 2,97 8.53 1.78 0. 85 0.11 8.90 18.96 
16C 3.08 3.97 ШЕ ШЕШ 0.09 6.86 19.50 
16D 3.09 6.29 1.81 0.93 0.15 9.39 20. 30 
16Е 2.68 5.78 2.25 1.08 0.12 8.60 
Е 2.49 8.12 2.18 0, 88 9.09 8.32 
16G 2, 85 3.00 1-15 D 0.14 8.91 
16H 3.25 Tad 1.65 0. 86 оп 9.05 in. ic 
161 3.19 5.95 1. 86 ON 0.13 8.47 20.16 
22 3.33 4.90) 1. 12 ë 0.17 10.50 23.66 
25 3.10 3.01 9.95 0.14 8.30 22.00 
27 Í 2.04 1.37 od 0.02 8.80 24.40 
28 р 2095 6.63 1.82 DE 9.14 3.90 21.50 
32 | 313 5.93 rg 1.08 0.10 8.70 21.50 


HP ЕРЕН Н Л.Р TE ЖК ААЛУ SERRE HE Tik k ЖП БЇ A 48 种 
GAME TT 种 主要 和 次 要 成 分 进行 分 析 的 结果 。 对 其 分 类 既是 化 学 上 的 问题 也 是 考古 学 的 
问题 。 由 子 巡 传 算法 可 在 高 维 变量 空间 进行 快速 、 有 效 地 搜索 ， 故 直接 将 原始 数据 标准 化 后 
作 模 糊 分 类 ， 不 进行 降 维 ， 以 充分 保留 原 有 数据 结构 。 经 典 的 模糊 * 均值 方法 《FCM) 易于 
路人 鞍点 或 局 部 舌 优 点 -1 我们 引 人 遗 传 算法 分 类 , 算法 收敛 情况 多 图 7-0, 从 图 上 看 开始 目 
标 函 数 下 降 较 快 ,接近 最 优点 附近 以 后 下 降 较 慢 , 用 本 方法 求 得 的 目标 函数 值 为 一 37. 9785. 
而 用 经 典 的 FCM 方法 任 取 初 始点 计算 5 次 ， 求 得 的 目标 函数 值 各 不 相同 ， 分 别 为 46. 8121、 


46. 8050 
本 算法 


+ 37.9785, 46.8050, 46. 8050, 可 见 经 典 FCM 方法 在 此 确实 易 陷 入 局 部 最 优点 .而 
下 受 影响 ,在 各 次 计算 中 最 终结 果 是 确定 的 , 均 为 37. 9785。 从 这 点 上 可 以 反 证 用 本 方 
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法 找到 的 元 能 是 全 局 最 优 。 

如 沿用 文献 [32] 的 样本 编号 ， 分 类 的 结果 只 体 如 下 。 

一 类 : 02A, 02B, 02C, 02D, 06C, 08. O9A. 09C. 13B, 13C, 13D, 13E, 13F 

O6A, 09B, 13A. 16C, 16D, 161. 22. 25. 28, 32 
03, 051, 06B, LIA, 11B. 12А. 12B, 14C. 14E, 15A, 15B 
ОЗА, 05B, 05C, 05E. 16А, 16B, 16E. 16Е. 16G. 16H 
OSH. 10А, 10B, 27 

第 一 类 与 文献 [32] 一 致 ， 即 原文 中 的 也 
ж. 第 二 类 由 文献 中 未 能 分 类 的 夫 散 点 构成 。 
为 便于 考查 零散 点 与 生 类 的 关系 , 将 第 二 类 所 l 
有 点 的 权重 列 于 表 7-18。 值 得 提出 的 是 , 文献 al 
[32] 中 ， 此 类 的 06A 和 098 被 误 分 为 类 n € | 
(与 本 文 第 四 类 相对 应 )。 该 文 作者 亦 知 从 考古 
学 家 的 观点 看 它们 不 应 属 玉 类 ,我 们 的 方法 在 — s 
这 里 威 功 地 将 其 从 世 类 中 别 出 .第 三 类 与 文献 p 
[42] 的 结果 基本 一 致 . 在 文献 [32] 中 它们 先 
被 分 为 马 类 和 C ж, 然而 , 在 讨论 中 结合 考古 b $8 8 05 30 
学 知识 分 村 时 ， 发 现 将 它们 分 为 一 类 似 更 全 ка 
理 ， 这 与 本 法 的 结果 不 谋 而 侣 。 另 处 ， 原 来 未 
被 分 类 的 样本 OST 也 被 分 人 第 三 类 ,其 权重 见 
表 7-18。 如 从 权重 看 ，05I 确 为 介 笠 第 二 类 
(0.2998) 和 第 三 类 (0. 3237) 之 同 的 点 ， 故 此 实际 上 是 与 文献 [32 的 结果 相 网 合 的 。 第 四 
类 与 文献 [32] 中 的 王 类 大 致 相对 应 。 不 同 的 是 本 方法 将 样本 16E 和 16F (文献 [32] 中 它 
TERIA BARR. 有 站 的 是 ， 在 文献 [32] 的 讨论 部 分 中 ， 件 者 按 考古 学 知识 得 出 结 

论 , 这 些 点 应 该 分 人 己 类 ( 即 本 文 第 四 类 ) ,但 用 他 们 的 方法 未 能 达到 .第 五 类 与 文献 “32] 结 
YEH) AAR) AER Be, И ЖАНЕР ЖОН ЖИН он BAA. ACH 
各 类 的 权重 看 ，05H ЕЛЖ Ж (0.2275) MBA (0.3142) 类 之 间 的 点 。 

所 有 与 文献 [32] 中 分 法 不 同 的 点 对 各 类 的 权重 见 表 7-18。 

总 之 ， 本 方法 分 闫 能 在 高 维 空间 中 进行 有 效 如 优 ， 分 类 结果 似 比 文献 [32] шаш, я 
外 ， 从 所 得 模糊 权重 再 仔细 查看 样本 点 与 各 类 的 精 组 关系 ， 可 能 更 有 利于 对 所 得 结果 进行 进 
一 步 的 探讨 研究 。 


F() 


Што ВМ 
ЕЕ BAUR 


表 7-18 与 文献 [32] 中 分 法 不 后 的 点 对 各 类 的 权重 


— 
每 类 的 权重 
# 本 
1 类 2 类 3% 4 类 5 类 
06A _ 0. 0735 0. 6023 0. 0534 0. 2403 0. 0305 
09B 0.0662 0. 8702 0.0708 о. 2680 0.0251 
13A METTE 0. 6478 9.0381 0.2523 0.0185 
16C 0. 1446 0.3834 0.1985 9. 2586 0.0499 
16D 0, 0283 0. 5869 0.0195 0, 8541 0.0111 
161 0.0168 0. 7383 0.0134 2. 2254 0.0082 
22 [0.0894 0. 4940 0.0845 _ [02131 0. 0580 
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续 表 
AW Н = 
样 本 一 -一 -一 一 -一 一 - 

1 类 2 类 ! 3 类 1 类 | 5 类 
23 0.0723 0.6544 0.765 0.1612 60356 — 
28 , 0.0467 0.4881 0. "361 0). 4665 0. 0242 
32 0.0454 0.4524 4 0.4220 0.0288 
05H 0.1909 0.1375 9 0. 1298 0.3142 
051 0.1500 | 0.2898 0. 3237 0.1554 0. 0711 
08 5.3382 0.2849 9.1738 0. 1835 0. 0497 
15E 0. 0868 | 0. 3631 0.175 0. 4768 0. 0238 
16F 0.1227 0. 2094 0.0642 9. 5676 0. 0361 

入 p Pg š 

RAW ”特征 投影 的 模式 识别 方法 
对 于 含有 4 个 参量 的 模式 矢量 ， 是 d 维 空间 中 的 一 个 点 ， 如 a 等 于 2 或 3， WY RRA 


图 形 显示 这 些 模式 矢量 。 图 形 旺 示 具 有 直观 性 ， 现 代 计算 机 提供 了 强 有 力 的 屏幕 图 形 显 示 功 
能 ,而 人 眼 且 有 很 强 的 识别 图 形 能 力 , 同样 的 字 由 不 同 的 人 片 写 ,人 有 眼 能 识别 其 细微 差别 ， 状 
VUES US. 在 二 维 或 三 维 空间 中 显示 的 模式 分 布 情况 , 借 人 眼 常 能 识别 存在 的 分 类 图 景 ,也 
就 是 说 人 了 眼 是 强 有 力 的 模式 识别 器 。 而 当 & >3 时 , 这 种 直接 显示 则 不 巨 能 , 这 就 涉及 降 维 的 
问题 。 如 何 将 2 维 空间 的 图 景 ,在 二 维 或 三 维 空 间 中 显示 出 来 并 尽 可 能 减少 原 d 维 空 间 中 
分 类 信息 的 到 失 ? 这 就 是 将 在 这 一 节 要 讨论 的 基于 投影 的 模式 识别 方法 主要 思路。 

基于 投影 的 模式 识别 方法 也 有 很 多 ， 其 中 最 重要 包括 主 成 分 分 析 的 投影 判别 法 〈 亦 称 
Karhunen-Loeve 变换 ，K-L 分 解法 )、SIMCA 方法 、 基 于 偏 最 小 二 乘 分 解 的 特征 投影 法 、 非 
线性 映照 投影 法 等 ， 因 其 具有 图 形 显 示 具 有 直观 性 ， 很 容易 为 化 学 家 所 理解 ， 故 它们 在 化 学 
模式 识别 中 得 到 相当 广泛 的 应 用 “~ 中 。 本 节 将 对 这 些 方 法 作出 介绍 。 


一 、 基 于 主 成 分 分 析 的 投影 判别 法 


基于 主 成 分 分 析 的 投影 判别 法 采 几 多 元 统计 中 的 主 成 分 分 析 方 法 ， 先 对 样本 量 测算 阵 X 
直接 进行 分 解 ， 只 取 其 中 的 主 成 分 来 投影 ， 然 后 进行 判别 分 析 ， 故 有 主 成 分 分 析 的 投影 判别 
法 之 称 。 对 样本 矩阵 进行 直接 分 解 在 数学 上 有 几 种 方法 。 在 化 学 计量 学 中 一 般 采 用 的 方法 是 
非 线性 选 代 偏 最 小 二 乘 算法 (NIPALS)59。 这 种 方法 实际 上 是 沿用 Von Mises WSR ARES”. 
另 一 种 方法 是 线性 代数 中 常用 的 奇异 值 分 解法 SVD. 奇异 值 分 解法 可 将 任意 阶 实数 分 解 成 
为 三 个 矩阵 的 积 ， 即 


X=Usy: 

式 中 ,5 为 对 角 和 矩阵 ， 它 收集 了 已 矩阵 的 特征 值 , U ЯП V Zr ly b HEP IF ALR HET E TERR 
阵 ， 收 集 了 这 些 特征 值 所 对 应 的 列 特征 矢量 和 行 特征 矢量 ， 在 多 元 统计 的 主 成 分 分 析 中 ， 一 
般 被 称 为 得 分 矩阵 和 荷载 矩阵 。 图 7-10 示 出 了 主 成 分 分 析 的 数学 与 几何 意义 。 一般 只 需 取 前 
几 个 大 特征 值 所 对 应 的 特征 矢量 作为 主 成 分 , PRENER X 的 样本 矢量 直接 对 它们 投影 就 
可 得 到 所 需 的 主 成 分 分 析 特 征 投影 图 〈 参 见 图 7-10) 。 

【基本 思路 】 

主 成 分 分 析 的 投影 判别 法 的 基本 思路 是 基于 主 成 分 分 析 所 得 的 主 成 分 轴 是 该 数据 矩阵 的 
最 大 方差 方向 , 朋 这 些 主 成 分 轴 相 互 正 交 (参见 第 六 章 第 四 节 ), 这 样 ， 就 可 保证 在 从 高 维 向 
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低 维 空间 投影 时 尽量 多 地 保留 有 用 信息 。 如 果 对 样本 量 测 数 据 和 矩阵 Х 的 构成 作 如 下 规定 ， 我 
们 可 以 很 清楚 地 看 出 主 成 分 分 析 的 投影 性 质 。 令 样本 数据 矩阵 可 表示 为 


Bi nac uil 
: 
| Tae Der Xs 
x= 一 | = Das xe cx] 
Tamara x 
ji 
Ma Anda — axi] 


RP, n 为 样本 点 数 ，< 为 样本 维 数 . xi (1 一 1，2，…，n》 称 为 样本 向 量 , x, G1 2. 6, 
d) 称 为 变量 向 量 ， 因 为 

X=USV' 即 XV—US 
亦 即 


XV= + C Yos ts Pal 


7 0| [—— —-— 
° un — 
— St pe 
一 CHEERS RE) 
得 分 矩阵 
《 列 正 交 短 阵 } 
特征 投影 图 


图 7-10 主 成 分 分 析 的 数学 与 几何 意义 示意 图 


"I Ер US 二 T[ 亦 称 非 标准 化 的 得 分 (Scores) ЕРЕ] 的 每 一 个 元 素 实际 是 每 一 个 样本 
MEE xj G=1, 2, n. л) 对 荷载 Coadings) WE V 中 的 每 一 相互 正 交 的 荷载 矢量 上 的 投影 
坐标 〈 内 积 本 质 上 就 是 投影 )， 它 反映 了 样本 与 样本 之 间 的 相互 关系 ; WETS, HB 
(loadings) 和 矩阵 的 每 一 个 元 素 实际 是 每 一 个 变量 向 量 (j= 二 1，2,，…，q) 对 得 分 矩阵 中 的 每 
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一 相互 正 交 的 得 分 矢量 上 的 投影 坐标 ， 它 反映 了 变量 与 变量 之 问 的 相生 关系 。 
另外 ,原始 的 主 成 分 分 析 一 般 是 对 数据 协 方 益 阵 进行 正 交 变换 而 得 〈 参 见 第 六 章 第 四 
TO. BJ 
Q'X'XQ—diag[A A. Ar] 
AP, QWIERE RMP, А, A A 称 为 数据 协 方差 阵 X'X 的 特征 什 。 它 与 前 述 的 奇异 
值 分 解法 所 得 的 3 RHEE, BIE PEE S, PAESI TEER RE U TO FT IE 2 EBE V^ 分 别 
有 什么 关系 呢 ? 


因为 
X=USV: 
即 
ХХ —VSU'USV' =VSSV'—diag[ АА = Q'X' XQ 
XWA SS—diagls. 55.00 ssa] азои Јар. si]. Д.Х = VSsv', Д 


V'X'XV=—diap [si ys 


…,s9]， 还 因为 Y' BRETT IE SEV :所 以 有 

у=0 #=А 0 1.2.3. 
这 就 说 明了 经 典 主 成 分 分 析 与 奇异 值 分 解法 的 关系 .在 Mat Lab 程序 中 ,做 主 成 分 分 析 就 完全 
可 以 用 奇异 值 分 解法 来 替代 了 , 实 因 在 MatLab 程序 中 奇异 值 分 解法 特别 简单 ,就 用 下 述 一 各 
话 即 可 得 所 需 结 果 : 


[U S.V ] 2 svd (X) 
【基本 算法 】 
主 成 分 投影 判别 法 的 算法 十 分 简单 ， 它 可 由 下 述 步 又 所 组 成 : 
COD 对 前 述 的 样本 数据 矩阵 X 进行 奇异 值 分 解 ， 得 
X=USV' 
(2) SUS=T= [ts tee +, 14], 得 非 标准 


2 化 的 得 分 (scores) HE, — Ж Ss, SF 8554 d 
je A DAIRA E n из, sta 来 进行 作 图 ， 
Ы А BDF G= 1.2.93 6071.2, 7 AMEB, 

e EA 得 如 图 7 11 所 示 的 主 成 分 特征 投影 图 , 不 同类 的 

| @ A pl 样本 点 聚集 在 不 同 的 位 置 .一 般 说 来 ,前 两 个 对 应 

g 四 于 最 大 特征 值 的 得 分 矢量 所 得 的 投影 图 所 含 信息 
最 多 。 

基于 主 成 分 分 析 的 投影 判别 法 既 可 用 于 判别 

@ | 又 可 用 子 取 类， 因 我 们 可 很 容易 地 从 投影 图 中 看 

zoe RASH, cE eM 


PC, 


别 法 在 化 学 计量 学 中 得 到 了 非常 广泛 的 应 用 。 
Ecl 脑 组 织 试 样 色谱 数据 的 主 成 分 投影 图 Jellum :等 用 毛细 管 色谱 法 对 16 个 脑 组 织 
试 样 进 行 分 析 ,在 色谱 图 中 取 多 达 156 £ E (T| BE 
TART 156 个 峰 处 的 峰 高 )， 组 成 (08X150 阶 矩 阵 ， 遂 过 将 环 阵 作 主 成 分 分 解 ， 分 别 求 得 对 
应 于 两 个 最 大 特征 值 的 得 分 矢量 扣 für, 并 以 二 s 为 投影 轴 作 图 , 得 到 如 图 7-11 HRA 
形 。 三 角形 是 有 脐 冯 的 脑 组 织 样 , 圆 是 正常 脑 组 织 样 。 有 趣 的 是 ,4 号 样 夭 标签 为 “肿瘤 脑 组 
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2A" Fé. 但 从 显示 图 看 , AFE ПЕ AO. 经 合 核 , 4 号 样 确 属 正常 脑 组 织 误 标 为 
“肿瘤 样 "。 从 这 个 例子 可 以 看 出 ， 用 主 成 分 分 析 的 方法 ， 取 最 大 的 2 GR 3) 个 特征 值 所 对 应 
的 得 分 矢量 ， 可 在 二 维 空间 (或 三 维 空间 ， 多 数 微型 计算 机 作 济 软件 有 二 维 作 图 功能 ) 显示 


样本 在 模式 空间 的 分 布 ， 用 人 眼 即 能 进行 分 类 和 判别 . 


二 、 基 于 主 成 分 分 析 的 SIMCA 分 类 法 


本 节 将 介绍 化 学 模式 识别 中 一 个 较 通 用 的 方法 


SIMCA 法 中 -全 ， 这 一 方法 根据 其 设 


计 者 定名 的 含义 [9 是 “统计 匀 线 性 多 元 分 析 ”， 或 “ 篮 类 的 独立 软 模式 ”， 意 为 各 类 样本 独立 
地 建立 局 部 “ 软 ” 模 式 ， 或 简易 分 类 算法 。 第 一 个 解释 较 确切 地 反映 了 此 法 的 特点 。 


【基本 思路 】 


SIMCA 方法 是 一 种 建立 在 主 成 分 分 析 基础 上 的 一 种 模式 识别 方法 ， 其 基本 思路 是 先 利 


用 主 成 分 分 析 的 显示 结果 得 到 一 个 样本 分 类 基本 印象 ， 


然后 分 别 对 各 类 样本 建立 相应 的 类 模 


型 ， 继 用 这 些 类 模型 来 对 未 知 样品 进行 判别 分 析 ， 以 确定 其 属于 哪 一 类 ， 或 不 属于 哪 一 类 。 


【基本 计算 过 程 ] 

在 介绍 SIMCA 如 何 具体 建立 类 模型 之 前 ， 首 先 
介绍 它 的 计算 全 过 程 ， 以 期 读者 先 对 该 方法 的 全 绽 有 
一 个 完整 的 印象 。 

SIMCA 方法 的 计算 全 过 程 由 图 7-12 示 出 的 框图 
给 出 。 从 此 框图 可 以 看 出 , SIMCA 实际 上 是 在 循环 地 
使 用 主 成 分 分 析 方 法 ， 它 先是 用 主 成 分 分 析 方法 来 得 
到 整个 样本 的 分 类 ， 然 后 ， 在 此 基础 上 ， 分 别 建 立 各 
类 样本 的 主 成 分 模型 ， 继 用 它们 来 检验 未 知 样本 ， 判 
别 未 知 样 本 的 类 别 。 由 于 整个 SIMCA 计算 过 程 可 在 
投影 图 上 直接 进行 ， 所 以 ， 只 要 计算 机 程序 的 人 机 对 
话 界 面 建立 得 好 ,此 方法 可 完全 在 图 上 直接 操作 完成 ， 
使 用 起 来 非常 方便 。 将 SIMCA 编 人 商业 软件 的 例 于 
很 多 ， 比 较 著 名 的 有 Unscramber 和 Serius 的 软件 。 

从 上 述 讨论 可 知 ， 在 整个 SIMCA 方法 的 计算 过 
程 中 ， 其 与 基于 主 成 分 分 析 投 影 判 别 不 同 的 地 方 在 于 
它 对 每 一 类 样本 进行 了 主 成 分 建 模 ， 在 此 将 对 这 一 部 
分 进行 较 详 细 的 讨论 。 为 讨论 方便 ， 首 先 介绍 基于 化 
学 计量 学 文献 习惯 用 法 的 一 些 表 达 式 。 首 先 ， 令 样本 
数据 矩阵 表示 为 


xi | 


[джан 
数据 预 处 理 


[ 无 居间 的 主 成 分 分 类 | 


* 


Ген 
| 
| 


对 变量 进行 加 权 处 理 


选择 主 成 分 建 模 的 主 成 分 数 日 


t e 


É assia 
EJ 


是 css 


L8 
[anra 


图 7-12 SIMCA 计算 过 程 框图 
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AP, n JERAR d 为 样本 维 数 。x (三 1,2,…,n) 称 为 样本 向 量 ， 则 一 个 样本 就 由 样本 
H+ RRA. NAX 
X=Ix +USV'+E=Ix -TV AE (7 86) 
X. ОБТ. T 矩阵 亦 称 非 标准 化 的 得 分 《scores) SME; ! 一 [1,1，… 1， 为 一 元 素 全 为 ] 
的 矢量 ， 其 维 数 为 x， 等 于 样本 的 数 日 ，x. 为 所 有 样本 的 中 心 拓 基 。 
X (17-86) 说 明 , 在 进行 主 成 分 分 析 之 前 ,对 样本 数据 矩阵 进行 了 中 心 化 预 处 理 。 对 于 每 
一 个 样本 矢量 ,根据 式 (7-86) 有 
k= Уна He GE 一 1.2， en) (7-87) 
在 上 面 两 趟 中 我 们 有 意 还 加 人 了 误差 矩阵 巨 、 所 以 在 第 二 个 式 中 也 引 人 了 一 个 误 痊 矢 量 
e 项 . 引 人 误 差 项 应 该 是 不 难 理解 的 , 实 因 在 主 成 分 分 析 中 、 一 般 都 只 了 到了 对 应 于 凡 个 大 特征 
值 的 特征 向 量 作为 主 成 分 ， 那些 很 小 或 只 占 百 分 之 几 的 特征 值 所 代表 的 特征 向 量 都 包括 在 误 
差 向 量 之 中 了 。 另 外 ,由 《7-86) 式 变 为 (7-87) 式 也 是 不 难 理解 的 , MRS X'=X—Ix.. 并 
略 去 (7-87) 式 中 的 误差 项 ， 就 可 以 通过 简单 的 代数 运算 而 得 到 上 述 的 样本 矢量 表达 式 。 因 


"M 4 " - 
aj xima =] Tatta 
‚Ыы sept n 
Loy Fog Tad 01 ОТЕ 
х=, | тие UY 
Zaza Ta x, Ent preys 
Lain Phe? Lud! M stint lea 


Zt Хатат Dobis 


asi 


[vimm ] 
tatanta | 


ted Xt pa Leaver Ооа 
ñ 3 T + 


Latasha | ~ : 
гюн Eravis tata 


[Etu [oaa wal) | Btu | 
Ç 


Xe Genel] (Yt 
=|! : = 3 (7-88) 
Xn. Dose] = | 


DA roan БУ | 


пайван x m Xu не, IM х= xb td te = 1,2 1 s 
了 这 样 一 些 说 明 ,讨论 主 成 分 分 析 建 模 就 不 困难 了 。 从 《7-88) 式 子 可 以 看 出 ,每 一 个 样本 矢 
量 可 以 表 为 荷载 矢量 的 线性 组 合 与 嵌 差 矢量 之 和 ， 而且， 由 于 荷载 和 撩 氢 是 相互 正 交 的 ， 这 为 
主 成 分 分 析 建 模 的 计算 带 来 了 很 大 方便 。 

【 主 成 分 建 模 算法 3 

{1) 定义 梓 本 到 主 成 分 模型 的 距离 
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БИСЕР (7-89) 
这 是 因为 样本 矢量 表达 式 的 前 一 部 分 ， 即 tavi 正 是 主 成 分 荷载 矢 居 的 线性 组 人 台 ， 属 于 可 由 主 
成 分 模型 表 出 的 部 分 ,在 样本 矢量 卜 达 式 中 没 被 主 成 分 模型 所 包含 的 就 是 误差 矢量 , ИРЦ, 
木 到 主 成 分 模型 的 距离 就 是 误 族 矢量 的 点 积 ，(7-89) 式 中 的 分 母 是 样本 矢量 存 建 立 了 主 成 分 
模型 ， 即 降 维 后 的 自 出 虚 , 由 原样 不 空 间 的 维 数 碱 去 主 成 分 数 而 得 , s 在 SIMCA 方法 中 常 被 
称 为 第 i 个 样本 的 残余 标准 偏差 residual standard deviation, RSD). 
(2) 定义 整个 类 的 均值 标准 偏 益 s 
HOD s= [sissit osssm 了 ， 则 整个 类 的 均值 标准 偏差 s 可 由 式 (7-90》 给 出 
scys/O ACD (7-90) 
C 90) RA (z 一 4 一 1》 为 分 母 的 理由 是 为 了 整个 类 的 均值 标准 偏差 不 受 该 类 内 样本 数 多 少 
的 影响 ， 矶 出 ， 还 考虑 了 由 于 引 人 4 个 主 成 分 所 失去 的 自由 度 。 
(3) 定义 刁 检 验 统计 量 
为 了 判别 某 一 样本 与 某 一 类 主 成 分 模型 的 差别 或 相似 程度 ，SIMCA 方法 的 提出 者 Wold 
ПАТЕН, AL ADIT TO АТ, 其 一 样本 的 残余 标准 偏 益 的 平方 只 和 整个 类 的 均 
值 标准 偏差 的 平方 分 别 共 有 自由 度 (dg 一 4) 和 (ed 一 4 4 一 1)， 据 此 ,我们 可 以 采用 自由 
Ad Аа - А) аА -1) 的 了 -检验 来 判别 某 一 样本 与 某 一 类 主 成 分 模型 的 差别 或 相 
ШЕЕ. .检验 (或 记 为 Fa 可 用 来 求 得 一 个 判定 某 样 本 是 否 属于 某 类 的 残余 标准 偏差 平方 
BS ERE. 


Sma = 5 Ferm 

ПЕЕ -— f Ë 
0.05 3R 0.01 BRAT, E 7-13 Aa T W frt 
水 平 取 0. 05 或 0.01 的 由 一 个 主 成 分 建 
立 的 类 模型 的 例子 。 

由 于 基于 主 成 分 分 析 的 投影 判别 法 
主要 是 依靠 人 眼 来 进行 判别 分 析 的 ， 为 
在 主 成 分 特征 投影 图 将 某 一 类 的 类 模型 
形象 给 出 , 故 Wold 建议 可 直接 从 得 分 和 
量 人 手 ， 直 接 找到 某 一 类 在 得 分 矢量 上 
的 上 限 与 下 限 值 ， 并 以 此 来 定义 主 成 分 Eris 由 一 个 主 成 分 建立 的 类 模型 
的 类 模型 。 某 一 类 在 得 分 矢量 上 的 上 限 ЖАКО 08 Ron 
与 下 限 值 可 由 下 述 式 〈7-91》 算得 


wma C12) 504 (7-91a) 
tone “(1/2 2500 G-91b) 
其 中 
satu fn 


在 此 ， 下 标 表示 第 a 个 主 成 分 。 图 7-14 给 出 了 - -个 由 一 个 主 成 分 建立 的 类 模型 例子 。 
对 于 任意 未 知 样本 х, 都 可 给 出 它 的 主 成 分 模型 
it Dia уте, (7-92) 


然后 计算 它 的 误差 项 we ， 继 算出 它 到 所 定义 的 主 成 分 模型 的 距离 ， 
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s—ee/(d—A) (7-93) 
Hee AAs 2 3017 Het, BI IRR XR F Mea Bl АН Ke Р Bros ERA, Me 
可 以 看 出 ， 只 要 求 得 了 该 未 知 样本 矢量 的 误差 项 ， 判 别 就 很 容易 了 。 所 以 ， 判 别 的 过 程 ， 主 


图 ?7-14 由 极端 得 分 值 表述 的 由 一 个 证 成 分 构成 的 类 模型 


要 是 误差 项 的 计算 过 程 。 未 知 样本 误差 项 的 计算 可 由 下 列 步骤 组 成 ， 

ФФ 

TE, x ВОНА LE. LAMA 

@ xac, 2, cs A e3ORAGIEG TOEUURUHE. URAR EEI REE I A i 
(а=1, 2, =, AD: 


e Pty, 
BERI e BEAR FEAR ZN, BUB FREIE "S ATOR ЕЩЙ ЛИНЕ Ж. 
s=ele/(d - A) 

上 述 求 未 知 样本 误差 项 的 过 程 始终 都 用 到 了 主 成 分 分 析 所 得 的 荷载 矢量 的 正 交 性 质 ， 即 
viv,=0 G= j), 

下 举 一 例 说 明 SIMCA 用 于 光谱 数据 解析 的 情况 , 欲 以 2C ki (NMR) 谱 数据 来 判 
别 降 冰片 烷 的 结构 ， 这 类 化 合 物 有 内 、 外 两 种 结构 ， 能 否 利 用 2C 核 赃 共振 谱 进行 这 种 判别 ? 
训练 集 由 2 位 取代 的 降 冰 片 烷 组 成 ， 

ехо(д=1) — endo(g=2) 


7 


CN 13 соон 
соон E COOCH; 
COOCH; 15 CH:OH 
CH.OH 
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用 降 冰片 烷 的 C, C, BRR EC 核磁 共振 谱 化 学 位 移 AS ESE. л 是 该 化 合 物 与 未 取 
代 降 冰片 烷 OG 一 H) 的 位 移 之 差 。 本 例 中 共有 15 个 样本 (一 15)，7 个 参量 (4 一 7), 2 个 
类 (8 一 2)。 先 对 原始 数据 进行 均值 中 心 化 预 处 理 ， 然 后 进行 万 监督 的 投影 判别 ,可 知 两 类 均 
可 用 一 个 主 成 分 模型 表述 (4 一 1) ,说 明 本 例 情况 较为 简单 . 恨 据 特 征 参 量 对 两 类 的 判 旭 能力 ， 
对 特征 参量 进行 了 选择 , 发 现 只 需 保 留 C,、C。、C; 的 化 学 位 移 A6, 删 去 其 他 参量 , 对 余下 的 
特征 参量 重新 计算 得 4。、vw, (B. SEOBIE sen (d—A) Als. 一 s's/(n 一 A 一 1) 对 诸 样 本 和 不 同 
的 类 分 别 计算 样本 残余 标准 偏差 s, 和 类 的 均值 标准 偏差 ;.、F- 检 验证 明 ， 训 练 集 的 这 些 已 知 
样本 无 不 正常 情况 .用 SIMCA 法 对 未 进 人 训练 集 的 降 冰 片 烷 试 样 进行 分 类 , 能 得 到 止 确 分 类 
结果 ， 甚 至 某 些 结构 与 降 冰 片 烷 近 似 的 化 合 物 也 能 给 以 分 类 ， 详 见 文 献 [44] 。 


三 、 基 于 偏 最 小 二 乘 的 投影 判别 法 


[E4821 

DBA RE, 防 最 小 二 乘 方法 本 质 上 是 -种 基于 特征 变量 的 回归 方法 |， 在 多 元 校正 中 
得 到 了 广泛 地 应 用 。 偏 最 小 二 乘法 与 主 成 分 分 析 的 不 辣 之 点 在 于 它 不 但 对 量 测 殉 阵 X 进行 正 
交 分 解 ， 而 且 在 分 解 的 同时 对 响应 矩阵 也 进行 下 交 分 解 ， 为 一 同时 进行 分 解 的 特征 变量 回 
BA. 如 果 将 模式 识别 中 已 知 类 别 的 响应 变量 设 为 0 或 1( 对 两 类 模型 而 言 ), 或 其 他 整数 ， 
1，2，3,，… 等 〈 对 多 类 模型 而 言 )， 则 偏 最 小 二 乘 也 可 用 于 模式 识别 ， 特别 是 因 偏 最 小 二 
法 也 是 一 个 特征 变量 法 ， 所 以 ， 它 也 同时 可 用 于 特征 投影 以 得 到 投影 图 ， ти 
本 点 投影 到 低 维 空间 进行 人 眼 判别 .由 于 PLS 可 同时 对 样本 数据 矩阵 X nipu ЖЕ [Н] Н} УЫ 
分 解 ， 并 力图 建立 它们 之 间 的 回归 关系 ， 所 得 投影 图 似 可 得 到 更 好 的 分 类 效果 。 

偏 最 小 二 乘法 已 经 应 用 于 很 多 不 同 的 研究 领域 ， 在 化 学 模式 识别 中 也 得 到 了 相当 广 证 地 
应 用 。 将 偏 最 小 二 乘法 用 于 有 机 合成 、QSAR 和 化 学 化 下 过 程 的 优化 是 化 学 计量 学 研究 的 一 
个 重要 内 容 。 

【几何 意义 及 其 应 用 讨论 了 

由 于 用 于 化 学 模式 识别 的 偏 最 小 二 乘法 的 选 代 过 程 也 是 通过 由 H. Wold 提出 的 非 线 性 选 
代 偏 最 小 二 乘 算法 而 完成 的 。 此 在 前 一 意 已 进行 过 详细 讨论 ， 所 以 在 此 从 略 ， 而 只 从 几何 意 
义 方面 进行 一 些 必要 的 讨论 。P1.S 分 解 具有 下 述 形式 ; 

X=USV'=U'S'VU 十 本 一 TY +E: 7-94) 

Y-PGQ-P'G'QU —E,—R'Q' +E, (7-95) 
RE, ALARA X 分 解 得 到 的 矩阵 T" ЖЕНИ БИШЕ Y. CIE BER RET 
除去 大 部 分 噪声 后 的 变量 和 响应 的 信息 。 经 过 这 样 的 分 解 , 我 们 可 以 得 到 两 个 分 解 的 矩阵 7 
和 忍 '， 继 将 这 两 个 分 解 的 投影 变量 而 不 是 原来 的 变量 矩阵 X 和 响应 矩阵 了 经 回归 联系 起 来 。 
首先 是 变量 矩阵 的 一 个 目标 样本 。 即 它 的 一 个 行 矢 基 x， 投 影 到 好 E. BE. FIER. 响应 
矩阵 的 一 个 目标 样本 ， 即 它 的 一 个 行 矢量 六, 投影 到 gr Е. (El rss HXE OR HEAT A, 
这 样 的 关系 在 PLS 中 称 为 内 相关 。 

偏 量 小 二 乘法 的 一 个 优点 就 是 它 可 以 在 两 个 矩阵 之 问 建 立定 量 关系 ， 这 就 使 具有 多 个 量 
测 响应 或 活性 矢量 y,(j 二 1,2,…,m) 的 预测 成 为 可 能 , 设 有 化 学 量 测 、 或 结构 信息 、 或 试验 变 
RER, M XER, EAE AIAR EKE у, Gsl 2, +, m) 所 构成 的 响应 
EEY, [yy ym)» 就 可 以 用 PLS 来 建立 这 两 个 矩阵 之 间 的 定量 关系 。 比 如 , 一 


370 


化 学 反应 可 在 一 系列 溶剂 中 进行 ， 每 个 溶剂 者 可 用 几 个 特征 变量 表示 ， 这 就 构成 了 变量 矩阵 
X, 用 不 同 的 溶剂 ,可 以 得 到 不 同 的 主要 产物 的 产 率 、 其余 副 产物 的 产 率 等 , 这 就 构成 了 响应 
ERY, 借 PLS 就 可 建立 它们 之 间 的 定量 关系 , 从 而 预测 新 的 溶剂 可 能 得 到 的 结果 . PLS Jj 
法 的 第 二 个 优点 就 是 它 可 以 运用 不 同 的 投影 图 来 评价 所 得 结果 。 对 于 大 多 数 情况 ， 对 这 些 图 
的 直观 解释 就 可 足够 理解 不 同 的 变量 与 响应 之 问 的 关系 了 。 

PLS 用 于 有 机 合成 的 例子 一 一 稻 化 反应 的 副 产 物 的 抑制 在 这 个 例子 中 ， 我 们 将 讨论 怎样 
应 用 PLS 方法 , 在 这 个 反应 中 找到 阅 整 哪 一 个 变量 就 可 以 提高 主要 产物 的 产 率 而 又 能 同时 抑 
制 副 产物 。 

所 研究 的 反应 是 用 3,3- 甲 基 -2- | 一 米 合成 吗 啉 烯 胺 。 本 反应 的 副 产 物 是 3.3- 甲 基 -2- 丁 
MM Aaa 


o я 
| — 


Wu N o7. 4 


N 、 
oS un 4 


dU BT EAE EE Py 30 BJ p= B p= E rM E N TT ИЕ PLS 方法 的 下 矩阵 
WY EBE, 它们 都 列 于 表 1-19, ERA. EX EB rE Ree T < 变量 的 平方 项 和 交 义 项 。 
在 做 PLS 之 前 ， 都 对 数据 进行 了 预 处 理 ， 好 自慰 度 化 。 
Hae 试验 设计 矩阵 与 响应 算 阵 


ү LEE" * OW 
HORS | -一 — 十 - 
| ЕЛ 4 г, у x: 

1 I а -T =1 ПИШЕ rr 
2 И 1 E -1 45.1 D 
3 -1 | 1 ] 31. 26.2 
" 1 i -1 $17 IDE 
Š 1 -1 | 47.8 I 11.8 
6 1 =l 1 57.1 ! n 
7 1 1 1 63.6 | 26,1 
8 —1 1 1 Du 11.0 
9 1.414 o u 66.7 8&1 
10 "n D v 49.5 inc 
n 59 1.414 E 75.4 18.9 
12 ° =La | ‹ 43.9 8.0 
13 о 0 1.414 68.1 9.8 
i o 0 Н ka 52.4 А 17.4 
15 ° 0 | 56.8 ! 13. к 
16 0 0 " 60.0 | 12.3 
1? о | 0 b | 58.6 | 12.6 
18 o i о " L 57.2 13.6 


Q ААТА о СКВО z REWE: RR CO WR E CD 


经 PLS 分 析 , 借 交 叉 校 验 法 发现 有 两 个 主 成 分 是 显著 的 , 它们 代表 了 了 矩阵 96. 20640 
方差 ,第 一 个 PLS 主 成 分 包括 了 Y 矩阵 47. 4% 的 方差 ,而 第 二 个 PLS 主 成 分 却 代 表 了 48. 8% 
的 方差 。 

从 数学 上 来 解释 PLS 分 析 所 得 到 的 结果 ， 针 矩阵 分 解 出 的 WW 为 : 
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,. [0.1814 一 0.9711 一 0.1317 —0.0622 0.0315 —0. 2267 0.0326 —0.0149 0. 0087] 
=La. 7863 0.1249 0.4986 --0.1648 —0. 1241 —0.0728 0.2199 0.0951 0.1111 
s 070.0837. —0. ио] 
Q'-! отвор —0. 6499 
这 样 、 X SRE HOGS) Fe HER AT BK (7-96) ИШ. 
t, =0. 1814x, — 0. 9711x; — 0. 1317% ~ 0. 0622х]— 0. 08155; 


— 0. 2267x5+0. 0326x,,— 0. 0149x,,--0. 0057 x23 (7-962) 
t, =0. 7863x, +0. 1249x, +0. 4986,— 0. 1648x;-- 0. 1241x} 
— 0. 07282-0. 2199x +0. 0951x,. 4-0. 1111xss (7-96) 
Tj 
ту — 0. 6637y, — 0. 7480y- 
r,7-0. 7600y, — 0. 6499y; 
两 个 得 分 矢量 间 的 内 部 相关 可 表 为 
r.= 0.97510, +e 
r= 0. 8802, +e 
RAM RBA. ИЖ 
R'-BTUVE (7-97) 
Xp BW AE: 


MELLE 
Lo 0. 88024 
注意 到 PLS 的 整个 数学 模型 可 表示 如 下 ， 
X—-USV'—U' SV" +Ex=T V" +Ex 
Y—PGQ'—P'G'Q" +E,—R°Q' Ey 
R'=BT'+E 
得 分 矢量 ri 与 的 内 部 相关 图 示 于 图 7-15。 


U, 


1 
$ 


15189 
19-18117-16———————» 
10 14 t 

a at 
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图 7-15 得 分 矢量 7 与 4 的 内 部 相关 图 
GO 第 一 个 主 成 分 ，(b) 第 一 个 主 成 分 
从 了 和 矩阵 的 荷载 矩阵 Q" ， 可 容易 地 计算 出 了 矩阵 与 得 分 矩阵 的 关系 ， 
yi — 0. 6499, 4-0. 76007. (7-982) 
у= — 0. 7480г, — 0. 6637r; (7-98b) 
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Yk (7-98) 可 以 看 出 ,为 了 增加 主要 产物 ORBO WK. BD уз, SOR RR ЕИ 
En 朝 负 方向 变化 , Mr 朝 正 方向 变化 ; 而 为 了 减少 副 产 物 的 产 率 ， 即 y， 试验 条 件 的 调整 
应 该 是 六 ЖП r, 都 朝 正 方向 变化 。 这 样 , 对 于 г, 来 说 ,增加 主旨 产物 或 减少 剧 产 物 发 牛 了 六 盾 。 
下 面 将 可 看 到 ， 这 一 矛盾 是 可 以 解决 的 。 

由 于 与 4 是 平行 的 , 所 以 可 以 通过 调节 来 代 答 x。 MX ЖЕКИ QU TAE HG. 
n 主要 与 x 负 相 关 OMA AE. 正如 r,t 的 减少 将 提高 MERE LIT IU 
詹 的 用 量 将 提高 主要 产物 y, 的 产 这 ,但 是 ,四 氧化 钛 用 最 的 提高 也 将 冒 提高 副 产 物 的 风险 ,这 
是 因为 4 的 减少 同样 会 提高 yo 对 于 第 二 个 PLS 主 成 分 4.， 它 主要 与 x; 和 x; 正 相关 ， 这 就 
ЕВН Яр ғ, г. 增加 ， 也 即 x, CORA BD 和 x。( 反 应 温度 ) 增加 ， 将 有 利于 主要 产物 的 产 
率 。 以 上 结论 与 用 响应 面 方法 所 得 是 一 致 的 。 

另 一 方 而 , PLS 方法 还 可 通过 投影 图 来 分 析 , 而 且 
它 的 分 析 比 起 上 述 的 数值 分 析 方 法 来 得 容易 ， 米 得 直 
观 。 因 为 荷载 投影 图 基 反 映 变量 之 间 的 关系 ,所 以 只 需 
将 9 对 人 Жу tiv :同时 作 图 (参见 图 7-16) ,就 可 以 得 

ы j| 到 类 似 结论 ， 

nu PLS: 从 图 7 16 可 以 看 出 , 1 和 2 Cy 和 ys) 的 变化 主要 
由 4 Bll x, 所 决定 (主要 反映 在 PLS; E), 3 和 5 (z, 和 
? zD ERRAT PLS: 的 变化 ,因为 1 El y, 处 于 正方 向 ， 
ЖЗ Ш x, fx. 的 提高 可 提高 y 产 率 , 而 2 即 
图 7-16 PLS 荷载 投影 图 у UF fF k 3 ALS BB x, 和 x 的 提高 可 降 你 y, 产 
Toye #—ун Sons 40а San 6 rh 率 , 这 些 结论 与 数值 分 析 的 结论 是 -- 致 的 ,从 这 可 以 看 

0 U ч» H. PLS 投影 图 的 分 析 比 数值 分 村 更 容易 更 直观 。 

另 一 个 例子 是 基于 Willgerodt-Kindler 反应 ， 它 同样 说 明了 用 PLS 也 可 对 离散 变化 进行 
乏 步 分 析 。 早 期 的 研究 结果 表明 ， 对 于 强 吸 电子 基 团 ,如 NO,、CN £, TH. 试验 只 局 限于 
包括 电 于 给 予 体 、 烷 基 和 讽 素 取代 基 。 


PLS: 


9 w ò 5 

| Vo. o] 

Y C—CH; ж — Y мен 
^N 
` 


最 初 是 选用 了 5 TO BLUR 2, ВЕЖ (Y=H, Me, Cl, MeO, Me,N) 组 成 了 反应 空间 
的 取代 基 轴 。 最 优 产 率 的 试验 条 件 一 般 都 是 由 响应 面 方法 求 出 ЖЮ SOR Td 7-20。 为 表 
征 化 合 物 ， 一 般 的 取代 参数 等 都 收录 于 表 7-21. 

首先 ,使 用 表 7-20 中 所 列 的 前 5 个 化 合 物 的 数据 作为 Y 矩阵 , 用 所 对 应 的 表 7-21 中 所 列 
的 5 个 化 合 物 的 结构 参数 数据 作为 区 矩阵 , 来 建立 PLS 的 定量 模型 , 对 以 毛 为 取代 基 的 情况 
来 作 预 测 , 所 得 结果 列 于 表 7-20 的 第 六 行 ,第 七 行列 出 了 用 响应 面 所 得 实验 结果 用 以 对 照 . 然 
后 ,将 氟 为 取代 基 的 数据 也 包括 进来 ， 对 溴 取代 的 情况 进行 预测 ， 所 得 结果 列 于 第 作 行 .第 
九 行列 出 了 相应 的 对 照 数据 , 从 这 些 结果 看 来 , PLS 方法 的 项 测 效果 是 很 不 错 的 。 在 这 里 , 我 
们 把 省 取代 的 数据 也 包括 进来 ， 对 甲 硫 基 取代 进行 了 预测 ， 同 时 就 按 此 条 件 做 了 试验 ， 所 得 
结果 列子 表 7- 20 的 第 十 行 , 从 这 一 结果 看 来 , 用 PLS 预测 的 结果 果然 与 实验 结果 吻合 十 分 好 
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(预测 98%. 实验 98%). BL] PLS 方法 是 一 种 很 好 的 定量 建 模 法 。 
表 7-20 Willgerodt-Kindler 反应 的 最 优 条 件 “ 


| 试验 最 优 条 件 i Fox 
маты mus - - 方法 
<. E ' ү TR | RE 
J Me ma | osa di “RSM. "T 95 
2 MeO ыз! 8.9 130 RSM 98.2 100 
3 H 7.5 10,3 123 RSM ' 968 34 
£ H с ыт 9.9 i 119 RSM 95.0 n 
5 мех 8.8 8.3 122 RSM во | вә 
EE | F um TH te | ps | so 
B F вз | aes us RSM 94.0 33 
m Br | 04 9.3 123 PLS 98.4 _ 
E Br 10.2 9.5 ul RSM 95.0 95 
10 7 MS | 14 “ed | 124 I PLS. 97.0 Е 


Da РН AY HEIE (molimo; asy MARE FRAY КИЙ (mol; moD : zy- 反应 温度， 实验 的 产 率 起 由 气相 色谱 
HW. 


表 7-21 取代 的 结构 参数 


[ТТ 1 2 3 4 3 6 7 8 9 10 1 12 13 14 


Me —0.0 - 0.17 —0.04 —0.13 Tia o 0.52 3.0 1.32 190 1.90 2.04 5.65 58 
мо | 4.3 —U 27 0.28 -0.51 -0.98 —9.23 %36 398 135 L90 LW #78 2.87 —U.02 
Hio 0 0 0 ° 0.32 0 2.06 100 1.00 1.00 1.00 1.03 9 
ci | вз? 0,23. 041 0.18 —0.97 -0.56 053 352 140 180 1-30 1.80 6.03 0.71 
MeN| — —0 83 010 —0692 一 - 0,43. 353 150 2.86 2,80 280 15. 0.18 
F | osa 006 043 —0.34 0.48 —0 14 0.27 285 135 1.35 135 )38 092 0.14 
Br | 0.47 023 0.44 —017 —1.16 —0 81 0.65 3. 1.95 1.95 1.95 1.95 888 0.86 
Mes | 03 0 0.2 —0.18 OT -075 бв: аз 170 1.90 1.90 3.26 i282 061 


Db -a Тай 诱导 参数 ); ?一 op (对 位 取代 基 的 Hammett 参数 ): 3-. 开 和 1 R (Swain-Lupton 取代 参数 ): 5 一 EE， 和 
аус СТаһ м; T—v (van der Waals #4); 8- Le 97/8, 10 Bu 11—Bo 127 В, (Verloop 立体 参数 )，13 一 
MR 《分子 折射 率 )，14 一 r (Hansch 亲 脂 参数 )。 
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жле ”计算 机 数字 模拟 法 


本 章 介 绍 的 计算 机 数字 模拟 法 是 研究 化 学 反应 、 化 学 其 测 过 程 中 的 误差 规律 和 进行 其 他 
化 学 过 程 的 机 理 研究 的 一 个 很 有 笋 的 辅助 于 段 ， 亦 属 化 学 计量 学 研究 的 一 个 重要 内 和 容 。 本 章 
将 以 两 种 不 同 的 模拟 方法 为 线索 展开 ,首先 ,对 于 基于 统计 机 理 的 Monte Carlo 数字 模拟 法 作 
出 介绍 。 波 类 方法 的 主要 特点 是 在 于 共 概 率 特征 、 在 化 学 动力 学 系统 的 模拟 研究 和 误 闫 分析 
的 模拟 研究 中 得 到 广泛 应 用 , 本 章 就 主要 以 它们 作为 具体 对 象 进行 详细 介绍 ,值得 提出 的 是 、 
对 于 很 多 别 的 分 析 过 程 ， 沪 方法 亦 可 同样 适用 . 所 以 ,掌握 该 法 的 基本 理论 和 基本 思路 比 抱 
具体 计算 机 程序 来 就 显得 更 重要 了 。 本 章 将 把 着 重点 放 在 介绍 该 方法 基本 思路 之 上 。 对 于 基 
于 微分 方程 数字 解法 的 计算 机 模拟 方法 ， 本 章 企 介绍 目前 在 应 用 数学 中 常用 的 一 些微 分 方程 
数字 解法 的 基础 上 .主要 对 化 学 动力 学 必 电 化 学 过 程 的 具体 模拟 作出 详细 介绍 ， 值 得 提出 的 
是 ， 革 于 微分 方程 数字 解法 的 计算 机 模拟 的 难点 不 在 于 其 具体 算法 ， 而 在 于 需 模拟 体系 的 微 
分 方程 本 车 及 其 初始 条 件 和 边界 条 件 的 确定 。 所 以 ， 木 书 的 介绍 重点 是 一 些 可 通用 的 微分 方 
程 数字 解法 。 


第 一 节 ”基于 统计 机 理 的 Monte Carlo 数字 模拟 法 


二 次 世界 大 战 期 间 ， 美 国 Los Alamos 科学 实验 室 的 研究 人 员 需 要 考察 核反应 的 屏 茂 问 
题 , 他 们 应 用 滚轮 赌 具 试 验 构造 理论 模式 ,一步 步 逼 近 了 问题 的 解 。 由 于 Los Alamos 的 研究 
项 目 当时 是 绝密 的 , 采用 著名 赌 城 的 名 字 Monte Carlo 作为 代码 ， 从此, Monte Carlo 模拟 方 
法 这 一 名 词 ， 成 为 随机 模拟 方法 的 代名词 。 

产生 与 组 合 具 有 特定 统计 特性 的 随机 数 是 异 拟 动态 随机 过 程 的 关键 ， 这 实际 上 就 是 随机 
变量 本 身 的 模拟 "。 随机 变量 服从 一 定 的 分 布 , 可 模拟 产生 服从 所 需 分 布 的 随机 数 . 有 时 和 欲 模 
拟 体 系 中 某 一 变量 是 一 个 确定 性 变量 与 一 个 随机 变量 的 加 合 ， 认 可 通过 计算 机 来 模拟 。 
Monte Carlo 模 拟 的 基础 是 对 任意 已 知 分 布 的 数学 抽样 , 即 在 计算 机 上 产生 任意 已 知 分 布 的 随 
机 变量 的 随机 数 。 最 容易 得 到 的 是 CO. D 区 间 均 匀 分 布 的 随机 数 ~。 从 均匀 分 布 随机 数 ， 通 
过 适当 变换 即 可 得 到 任意 分 布 的 随机 数 。 然 后 介绍 如 何 由 均匀 分 布 随 机 数 产 生 任 意 分 布 的 随 
机 数 。 值 得 指出 的 是 ,在 计算 机 上 产生 的 随机 数 ， 是 所 谓 “ 伪 随机 数 ”， 即 用 数值 方法 产生 的 
重复 再 现 的 《周期 性 的 )“ 随 机 ” 数 。 取 同样 的 起 始 值 ， 得 到 的 随机 数 系列 总 是 全 同 的 。 


一 、 伪 随机 数 的 产生 方法 


(一 ) 均匀 分 布 的 伪 随 机 数 的 产生 方法 
对 于 计算 机 上 产生 的 均匀 分 布 的 随机 数 系列 ， 要 求 在 指定 区 间 均 匀 分 布 ， 即 每 个 数 有 相 
同 的 出 现 概率 数字 之 间 要 实际 上 相 开 独 立 ， 并 在 指定 的 长 度 区 间 内 次 序 不 重复 ， 但 又 具有 
一 定局 其 性， 而且， 所 用 的 算法 应 快速 。 占 用 内 存 少 ， 下 曾 将 介绍 两 种 最 常用 的 方法 。 
RAK ЖЕЕ ЛЕ (0, D 区 问 均匀 分 布 随机 数 序列 的 选 代 计 算 公 式 为 
1,43, a (modm). norim (8-1) 


ЖЕҢ. x, 是 伪 随 机 数 ，i 是 产生 序列 号 , m 是 一 个 用 作 模 数 的 大 的 整数 ，« 是 整 常 数 。 通过 调 
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Жа, т BURA RRA. LRM BME. x, Вах RU m BORK. 2,7 
m 就 是 第 i 个 在 (0,1) KEHA ER ЖЕЕ SRN ATA — IS BEBURGR ro 
由 于 z, 是 除数 为 m 的 除法 中 的 余数 ， 所 以 Олут, MOS sl, BA, 不同 的 zx, А 
最 多 只 能 有 > 个 ， 因 此 不 同 的 ,最 多 也 只 能 有 zm >. RARE HA ЖЯ {x,} АЖА 
Mt. ЖИЙ Тет, PET 个 数值 后 会 发 生 循环 .周期 了 的 长 短 以 及 一 个 周期 之 内 数目 系 
列 (m ro oo} 随机 性 的 好 坏 ， 与 参数 a、m 和 z, 的 选取 有 关 ， 

жаі 几 个 实际 应 用 和 检验 过 的 参数 值 和 周期 一 般 用 半 经 验 的 方法 来 选择 参数 a 
т 和 xz。 使 系列 ix,} 的 周期 比较 长 、 随 机 性 
比较 好 .在 计算 机 上 实际 产生 出 系列 {7,} Ж 


2 
2% 后 用 统计 检验 方法 检验 之 的 随机 人 性 数值 
2 ш 1 r TE (0, D 区 间 上 分 布 的 均匀 性 及 相互 间 的 


独立 性 . 一些 文献 推荐 下 列 类 型 的 参数 值 : 取 xz, 一 1 或 任意 奇数 . ж=2'. ast! k fle E 
是 正 整 数 , 则 由 选 代 式 (8-1) 所 产生 的 系列 周期 为 了 = 2° ° R81 给 出 几 个 已 经 在 计算 机 
上 实际 应 用 和 检验 过 的 参数 值 和 周期 。 

混合 同 余 法 ”混合 同 余 法 的 选 代 计算 公式 为 

r=arite (mod m) rrm (8-2) 

在 此 ， zo is m Aa REN. c HERR — ААН, Ж a. c. m 可 控制 产生 
的 仿 随 机 数 系列 的 特性 。 如 取 m=, a= 2°41 或 a 二 49 一 1，., 取 任意 非 负 整 数 , Е Е 
机 性 好 ， 且 有 最 大 周期 了 二 2 的 随机 数 系列 tr, 

Cn VITIS EE 

方法 1 Hbrorecten An PANDA AVE (0, D ЖЕРЛЕ. dUTEGO = 
1/2,DG.)=1/12. 根据 李 雅 普 诺 夫 中 心 极限 定理 推 知 ， 当 上 充分 大 时 ， 


т VE Sree] (8-3) 


的 分 布 渐 近 于 均值 为 零 、 方差 为 1 的 标准 正 态 分 布 , 记 为 N (0.1), BATH т, 近似 地 取 为 服从 
标准 正 态 分 布 的 随机 数 。 通 常 可 肥 10、11、12 等 数 ， 其 中 尤 以 取 12 为 最 简 使 "í k R 
12 时 
=r tr =e rÂ 
再 由 线性 变换 
w=atop 
即 可 得 到 均值 为 a， 均 方差 为 o 的 正 态 分 布 的 随机 数 o. 
方法 2 有 取 两 个 独立 且 在 (0,1) 区 间 均 匀 分 布 的 随机 数 =. =. EER 


P= 2lnr.)- icos(2nr,) (8-4а) 
t= Co Ine, ) sin (2и) (8-4b) 
则 刃 是 两 个 独立 的 服从 标准 正 态 分 布 随机 数 。 


再 由 线性 变换 
wo 二 a 十 gh 
w= a+ 
即 可 得 到 均值 为 a, 均 方差 为 o ПЕТА ВЕЕ o; 和 s 
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由 均匀 分 布 的 随机 数 还 可 以 产生 其 他 任意 不 同 分 布 的 随机 数 ,如 油 松 分 布 指 数 分 布 等 ， 
因 它们 在 化 学 中 不 太 常 用 ,在 此 不 再 作 详 细 介 绍 了 ,读者 可 参阅 文献 [4.5]。 另 外 .在 MAT- 
LAB 程序 语言 中 ,都 备 有 均匀 分 布 和 正 态 分 布 的 随机 函数 .可 以 方便 使 用 。 


二 、 化 学 动力 学 系统 的 Monte Carlo 模拟 算法 


基于 化 学 动力 学 对 待 测 物 进行 定性 定量 分 怕 是 分 析 化 学 的 一 个 重要 分 支 . 所 以 ， 化 学 动 
力学 系统 的 模拟 在 分 析 化 学 中 占有 重要 她 位 ,对 化 学 动力 学 的 研究 ,采用 Montre Carlo 模拟 技 
术 ， 可 以 避 开 解 微分 方程 的 困难 ， 因 而 不 需 引入 为 解 微分 方程 必须 附加 的 限制 条 件 或 有 关 的 
稳 态 近似 假设 [9。 事 实 上 ,用 Monte Carlo 技术 来 研究 和 模拟 化 学 动力 学 过 程 . 就 是 将 化 学 反 
应 的 有 效 磺 撞 过 程 看 成 是 一 个 随机 过 程 ， 在 此 随机 过 程 中 ， 化 学 反 永 的 有 效 磁 撞 的 儿 它 将 由 
反应 的 速率 常数 的 大 小 和 反应 物 的 浓度 来 决定 .本 节 将 用 -些微 分 方程 易于 描述 的 反应 为 例 ， 
以 说 明 此 法 的 基本 原理 -1。 

先 考察 最 简单 的 单 分 子 反应 


A+B 
这 里 反应 物 分 子 A 按 一 级 反应 分 解 为 产物 分 子 了 .放射 化 学 中 的 改变 反应 一 般 属 于 这 种 
类 型 ,为 了 用 Monte Carlo 方法 模拟 这 一 反应 , 可 将 计算 机 内 存 认 作 反应 器 , 将 分 子 А (以 数 
字 1 & л) 存储 子 其 中 , 具体 而 言 , 可 设 一 个 数组 то. 令 其 在 指定 的 序 叶 i 内 存储 数字 TX 
表 分 子 A。 作 为 起 始 浓度 ，1 的 个 数 代 表 了 A 分 子 的 多 少 ， 即 
[Theocr AT. 


或 
1 一 ae[Aw (8-5) 
Rp, a 为 比例 常数 。 可 另 选 用 数字 0 代表 不 参与 反应 的 溶剂 等 惰性 分 子 , 为 了 模拟 反应 容器 
的 真实 情况 ， 应 随机 地 将 1 与 0 存放 在 当 作 反 应 容器 的 计算 机 内 存 位 置 ， 即 数组 的 不 同 随机 
序号 中 。 但 也 可 不 必 这 样 作 ， 例 如 共 250 PSP T A (1), 750 个 分 子 B (0)， 可 分 别 放 在 1 一 
250 及 25] ~1000 位 置 上 ， 而 下 面 取 用 这 些 分 子 时 ， 采 用 随机 的 办 法 ， 效 果 与 随机 存放 是 相 
同 的 。 
先进 行 随机 模拟 。 本 例 中 ， 令 程序 产生 1 一 1000 的 随机 数 。 设 出 现 的 随机 数 为 31. 即 选 
API 号 位 置 上 的 元 素 ， 该 元 素 是 1， 反 应 发 生 ，1 转化 为 2，2 代表 分 子 B。 它 在 反应 前 是 
不 存在 的 ， 同 时 ， 记 录 一 个 反应 时 同 。 如 下 一 个 产生 的 随机 数 是 304. 则 不 是 数 1， 而 是 代表 
情 性 分 子 的 0， 此 时 无 化 学 反应 发 生 .。 仍 记录 一 个 反应 时 间 。 如 下 一 人 随机 数 是 另 一 全 存 有 1 
的 位 置 的 序号 数 ， 则 该 处 的 1 换 成 2， 又 记录 反应 时 间 ， 余 类 推 . 设 下 一 个 随机 数 又 出 现 31， 
此 时 31 处 已 是 2?， 同 样 匹 反应 发 生 ， 因 不 考虑 逆反 应 ， 同 时 记录 反应 时 间 。 
然后 对 模拟 过 程 进行 分 析 。 可 以 看 出 ,分 子 A 即 数字 1 被 选取 一 一 亦 即 发 生 反 应 的 概率 ， 
是 与 置 放 它 的 内 存 空间 及 A 的 个 数 有 关 的 。 可 按 类 似 通常 处 理 一 级 单 分 于 反应 的 办 法 对 这 个 
模式 进行 数学 处 理 : 
—d[1J/4N; 2 8(1] (8-6) 
式 (8-6) 左 边 是 数字 1 被 ?2 取代 的 速度 , N 是 单位 时 间 内 程序 试图 找 出 1 的 次 数 , 方 括号 代表 
相应 粒 了 的 浓度 , 8 是 只 与 反应 “容器 ”大 小 有 关 的 概率 常数 。 显然 当 1 渐 为 2 取代 时 , 反 
应 速度 会 下 降 
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将 式 (8-6) 积分 得 
штп] SAN, (8-7) 
008-7) PTT), 是 粒子 A HPE “ИО”, DI 为 其 存 时 间 z 的 浓度 、 考 虑 到 式 8-3 及 
-1J=a[A] 
可 以 宇 出 
[АЛАТ = 2N 
RIMEN EE ORE Eb) 
[АЛЛА]! =k 
可 知 
PN — kit 
Ш—# БМ PR ЫЕНЕН. STARR ИКЕ ЖЕШ SEDE EE IRAE T 
的 次 数 .可 见 . 一 级 反应 的 Monte Carlo 模拟 的 时 间 单 位 与 实际 反应 的 时 间 之 间 的 关系 是 很 简 
明 的 。 
上 述 模 式 易 推广 到 较 复 杂 的 情况 . 例如 序 吐 反 应 : 


лв 
超常 规 方 法 处 理 
—d[A J]/di=&[A] (8-82) 
= d(B]/de — 5, A ]—A, 7B] (8-8b) 
—d[CT/àr-& Lh] (8-8) 


4:084, CAT-[AT] [B СС) 均 为 零 ,由 此 可 得 
[AJ=[AJexp(—&) 
[B] (АГА) А) exp (— Ait) —expC £n] 
CC] ГАЗІ [17 Gs b) ]Uesexp C — E) exp А07) 
REX, IC BL О De АГИЕВ, ЖК ИЖЕ ЖЕЕ - 例 复 杂 。 现状 察 如 何 用 Monte Car- 
lo 方法 模拟 ,以 数字 1 代表 A, 数 字 2 代表 B, 仍 以 计算 机 的 内 存 作 反 应 “容器”, 将 数字 存储 于 
其 中 ,显然 ,开始 时 仍 只 需 存放 数字 1。 
—-d[1]/4N = [17 
—d[2]/aN;— 8,127 


AF A, b 均 只 与 反应 “容器 ”大 小 有 关 ， 这 里 涉及 的 是 问 容器, ROPE. 记 为 3. 将 
上 述 两 式 积分 后 ， 并 采用 与 上 例 相同 思路 得 
BN =k 
BN,=b;,t 
二 式 相 除 得 
МУ Мад д. 

ШИНЕ — 17 REIR HERE , BI Monte Carlo FERME A — 965 ЛА, BLAS Ft ERE EHE 
速度 常数 值 的 比例 进行 模拟 试验 , 即 寻 找 1 5 2 的 次 数 之 比 应 等 于 两 个 反应 速度 常数 之 比 .对 
于 较 快 的 《速度 常数 大 ) 的 反应 . 应 在 单位 时 间 内 多 模拟 试验 , 这 样 模拟 才能 反映 客观 情况 。 
例如 ， 序 贯 反应 


379 


ATO LU ee 


A Bo >C 


用 入 转化 为 B 较 B 转化 为 C Mb X EAR Klik BET RD ST FUR RE Ar E 
QR НУКА —Ж ДЕШ РИЯ Monte Carlo 方法 的 基本 原 
BE. ше Mk 的 最 大 公约 数 , 它们 的 最 大 公约 数 为 2. 0, 就 以 2. 0 为 计数 单位 进行 模拟 。 由 
于 每 模拟 А-В 反应 二 次 ， 应 模拟 BHC 反应 一次， 可 设置 一 个 计数 器 SN， 先 令 SN 二 2.0。 
然后 检查 SN SU ERTL. PAT 2. 074. 0 和 2. 08:6. 0 均 成 立 , 将 阿 个 反应 各 模拟 试验 一 
次 ; 然后 . 令 SN 增值 . 02.08 SN=4.0, 再 检查 SNL, BGM, RAR. 再 将 
两 个 反应 各 模拟 一 次 ; 再 令 SN 增值 , 加 2.0 48 SN=6.0. 此 时 , SNS 已 不 成 立 ， 停 止 模 
WAB. HRM BC 反应 一 次 ,如 此 下 去 ， 每 次 检查 SN<Max (G) 是 否 成 立 、 如 此 
式 成 立 ， 继 续 令 SN 增值 ; 如 SN 已 等 于 或 大 于 中 数值 最 大 者 ， 则 记录 一 次 反应 时 间 . 用 
这 样 的 方法 ,能 实现 在 单位 时 间 内 , 使 二 大 的 反应 模拟 次 数 较 多 ， 定 昌 地 反映 出 反应 速率 不 
同时 的 客观 事实 。 用 此 Monte Carlo 方法 模拟 序 贯 反应 , 所 得 结果 与 解 微分 方程 法 一 致 用 同 
样 的 原理 模拟 可 北 反 应 、 二 级 反应 及 复杂 的 反应 。 都 能 得 到 正确 的 结果 。 将 该 法 几 于 离子 电 
极 跟踪 的 催化 动力 学 反应 H， 取 得 了 有 价值 的 结果 。 


三 、 适 用 所 有 均 相 化 学 反应 体系 的 Monte Carlo 计算 机 模拟 方法 


以 上 介绍 的 模拟 方法 很 直观 ， 容 易 理解 但 也 存在 一 些 弱点 ， 次 对 于 稍 复杂 的 反应 ,用 
数组 来 存储 反应 粒子 所 需 内存 要 大 ， 另 外 ,模拟 复 杂 反 应 时 ， 简 单 从 数组 中 取 活 性 粒子 〈 反 
应 物 ) 或 情 性 粒子 (溶剂 或 傅 性 化 合 物 ) 来 机 械 式 地 模拟 化 学 反应 所 花 时 间 也 攻 。 为 此 Gille- 
spie 根据 将 化 学 反应 社 程 认 作 随 机 过 程 的 假设 ,提出 了 颇具 独到 的 新 算法 "1. 本 书 作者 在 此 法 
的 基础 上 ， 提出 一 种 适用 与 所 有 均 相 化 学 反应 体系 的 Monte Carlo 计算 机 模拟 方法 >“、 现 将 
其 介绍 如 下 。 

(一 ) 算法 的 基本 原理 

算法 的 基本 原理 是 将 计算 机 内 存 认 作 一 反应 器 .其 中 存储 了 各 物种 的 浓度 ， 发 生 一 次 化 
学 反应 ， 对 应 的 反应 物 或 生成 物 就 分 别 践 少 或 增加 1 个 计算 机 单位 钰 度 ， 计算机 记录 这 一 变 
化 同时 记录 下 反应 所 需 时 间 ,为 此 需 解决 :四 对 于 存在 ”种 物种 与 z 条 反应 通路 的 反应 体系 ， 
在 下 一 时 刻 是 哪 一 个 反应 发 生 ? D 发 生 反应 需 多 少时 间 ? 有 无 几乎 同时 发 生 的 其 他 反应 ? 如 
有 ， 在 模拟 中 如 何 体现 ? 

1. 有效 碰撞 与 分 支 反应 

从 反应 速率 的 碰撞 理论 可 知 ， 一 均 相 化 学 反应 分 支 ?， 即 

A+B—>C-D 


ELI B SE (dea / de) 76 4x P RC E F GA ЖОНЕ $ a CO BE RE LR 

dca/dt —&cacs =a (i) 
如 体系 中 存在 m 个 分 支 , 则 各 分 支 反 应 的 巡 率 应 与 其 有 效 碰撞 数 一 致 . 设计 算 机 每 次 反应 的 
分 子 数 一 定 ， 则 在 计算 机 模拟 中 下 一 时 刻 最 大 可 能 发 生 上 反应 的 应 是 有 效 碰撞 数 最 大 的 分 支 反 
应 ,。 令 计算 机 的 模拟 过 程 为 -- Markov 随机 过 程 , 其 游 走 由 时 刻 : 体系 发 生 第 i 分 支 反 应 的 概 
ЖР GÐ RR. BM, 


PC |p) =a) /ao 
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其 中 
а= Маб) Gc lesa) 
= 


模 氢 中 可 产生 一 个 (0,1) 区 间 均匀 分 布 的 随机 数 *， 如 有 下 列 关系 成 立 ， 


Вара РО] E012. 


= 


AP PG|O3 i=0 в, MHRI Gtb 分 支 反 应 。 
2， 反 应 时 间 
OO 计算 机 “反应 时 间 ” 与 实际 反应 时 间 的 换算 ”在 模拟 中 , 需 假设 一 最 低 反应 浓度 , 如 
所 模拟 的 反应 精度 要 求 高 ， 可 将 此 值 定 小 些 ， 反 之 可 定 大 些 。 
设 进行 计算 机 模拟 的 最 低 反应 浓度 为 [М], ШШ 
[MJ=+[ej= Er ш 
Җор, [=] 表示 反应 物 时 取 负 号 ,表示 生成 物 时 取 正 号 ,以 保证 ГМ] ESEN., GE ГАНЕ 
反应 浓度 即 可 算出 一 次 反应 所 需 时 间 Az 
Ar=[M]/(kcaxcu) 
如 反应 体系 存在 有 m 个 反应 分 支 ， 则 计算 机 每 进行 一 个 分 支 反 应 所 需 时 间 为 
At — [M]/aG) 
(2) 偶合 反应 体系 的 “计算 机 时 间 ” 与 实际 反应 时 间 的 换算 ”对 于 稍 复杂 的 化 学 反应 体 
系 ， 大 都 存在 几 个 分 支 反 应 ， 而 在 计算 机 模拟 中 ,每 次 只 能 进行 一 种 反应 。 如 何 将 此 情况 的 
计算 机 时 间 正 确 地 换算 成 为 实际 体系 进行 反应 所 需 时 间 是 实现 该 模拟 算法 的 关键 . 根据 Ost- 
wood 反应 独立 共存 原理 "1， 即 任 一 反应 的 速率 与 其 他 反应 的 存在 无 关 ， 存 在 多 分 支 反 应 时 ， 
每 一 瞬间 应 有 m 个 分 支 反 应 几乎 同时 发 生 ， 可 分 向 种 情况 进行 过 论 ， 
© 设 在 反应 体系 中 同时 存在 m 个 分 支 反 应 , 经 ?次 计算 机 进行 的 化 学 反应 后 ,mm 个 分 支 
各 自 所 需 时 间 为 


nL—nM,—n[M]aG) (=—1,2, um) 

式 中 ,ni 表示 在 总 数 为 n 次 计算 机 模拟 反应 中 第 i 分 支 反 应 所 发 生 反 应 的 次 数 , 有 台 n = ni 
aLL) SRC aC usa (2) 一 CuCm;…， 如 存在 偶合 , 则 有 下 标 (j.*,i ym,…) 中 任意 两 个 相等 的 
情况 。 

Fi nec PG lO WAR (8-9) IE 

nat Dmax sen, a Оп — 1) п, lalm) (8-9) 

实际 模拟 时 , 取 LM] /a G0) G 1,2 nO HS LE ET Ton КҮ ЖЕШ SL 
应 所 需 时 间 。 

@ 如 在 反应 体系 中 还 存在 连 串 反应 或 自 催化 反应 , 且 它 们 之 间 的 还 率 常数 相当 悬殊 , 则 
在 计算 平均 时 间 时 需 删 去 一 些 分 支 反应 的 时 间 , 并 认为 此 时 体系 的 反应 时 间 应 完全 由 其 反应 
速度 的 决定 步骤 来 决定 。 如 有 反应 : 


Ay ke 
А ——>B—C [2220 


И 5 
a+b соса —>d kk 


EEDA R OF DE u ЖЕ E CR OS — 1-29 E BUE RE BLUR m /a (1) 58 n/a OY TG 
近似 相等 。 因 在 复杂 反应 体系 中 上 述 情 况 普遍 存 在 ， 故 计算 反应 体系 的 实际 反应 时 间 时 ， 不 
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REA Bg Sic БЕЛЕЕ] ЇЙЇ [Н] SE Py, mu АУУП ЖОЛУ SNL, ERR КЇЛ 
支 反应 时 间 取 均值 。 

(二 ) 模拟 算法 

模拟 算法 由 下 述 步 又 组 成 ， 

第 -一步 ， 输 人 反应 体 系 的 所 有 速率 常数 及 各 物种 的 初始 浓度 。 赋 rs 初 值 为 零 。 

第 二 步 ， 赋 各 个 分 支 反 应 时 间 GT 1,2 EAE, 

第 三 步 , Ra 初 值 为 零 。 此 步 的 意义 是 使 每 次 输出 数据 时 ,至 少 进行 了 500 次 ， 以 保证 
必要 的 计算 精度 。 

第 四 步 , 计算 游 走 概率 PG 1.2 n n) ,产生 (0,1) 区 间 均 名 分 布 的 伪 随 机 数 ,根据 随机 
数 来 决定 ~ 一步 反应 的 进行 。 


输入 速度 常数 < — 
ADARRE 


ixa RE ng REY 一 
D REA — 1,2 | 
NEM 
"n 
i 
HB eG) aG)C CCOXIX Qui — 1,2, 
aod арыйа, (e Соно 
as a. a 
产生 随机 数 nm dati; лайл 
m 
- XR eX» 
aXrER in 
| [ERRIREN [ ano ажна. |! 
; HAD REM, i AER IMS EISE. 
| 部 计算 反应 时 间 ， о наана. | on wen) + BE 
| i -p= -E Í (m) = tn 
! m= + PH i AK DEER TD Rr ; | 
{ Ол | Š 一 NENNEN 
L * " RS 


эни. AFAR | 
| ИНЕ ces 的 子 程序 

mmn 
— = < tes O17 8 


E 


+> 
输出 :为 RE WH RE 


图 8-1 化 学 动力 学 Monte Carlo 模拟 程序 框图 


第 五 步 , 进行 第 i 个 分 支 反应 , 并 计算 该 反应 进行 所 能 时 间 。 如 果 л, 大 于 500, 用 子 程序 
剔除 非 决 定 步 又 的 分 支 反 应 时 间 ， 然 后 计算 t+w， 如 此 时 tps >O. 1s， 则 此 时 输出 各 物种 浓度 
值 ， 否 则 返回 第 三 步 继续 运算 ， 直 至 tee > 0. 15 时 输出 数据 ， 输 出 数据 后 返回 第 四 步 ， 如 此 
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往返 。 

第 六 步 , 比较 ta 是 否 达到 所 要 求 的 反应 时 间 . 如 木 达 到 ,返回 第 二 步 , 直至 tg KAM BR 
求 的 反应 时 间 hx 时 则 停止 。 

计算 机 模拟 程序 框图 示 于 图 8-1。 

用 此 法 对 著名 的 Belosov-Zhabotinsky 化 学 振荡 反应 的 Oregonator 模型 "进行 了 模拟 ， 
获得 满意 结果 "1 值得 指出 的 是 , 仅 用 模拟 方法 不 能 对 有 关 反应 机 理 作 上 出 最 后 肯定 的 判别 . 模 
拟 方法 能 发 现 有 的 假设 的 机 理 与 实验 结果 不 符 ， 从 而 否定 这 种 假设 但 在 模拟 预测 的 结 采 与 
实验 一 致 时 ， 应 进步 作 深入 的 研究 ， 例 如 ， 设 法 找 出 有 有 关中 间 产 物 的 直接 实验 证 指 。 


四 、 误 差分 析 的 Monte Carlo 模拟 算法 


任何 化 学 量 测 技术 与 相应 数据 处 理 步骤 均 涉及 误差 问题， 误差 的 大 小 和 不 同 分 布 对 分 析 
结果 将 产生 重要 影响 。 各 种 仪器 的 误差 的 不 同 特性 和 大 小 原则 上 可 通过 实验 的 方法 ， 即 通过 
反复 分 析 已 知 试 样 或 标 样 来 获得 ， 可 惜 此 法 耗 财 费时 ， 卫 不易 分 判 查 明 各 个 环节 与 因素 是 怎 
样 通过 误差 来 影响 分 析 结 果 的 ， 此 时 ， 如 采用 计算 机 模拟 方法 就 显得 比较 关 活 且 方 便 ， 它 不 
但 可 以 模拟 各 种 不 同 分 布 的 误差 将 怎样 影响 结果 ， 而 且 还 可 考察 出 测 芋 过 程 中 什 意 步骤 对 结 
果 影 响 的 大 小 .采用 前 节 介绍 的 随机 数 发 生 技术 , 为 计算 机 模 所 误差 分 析 提 供 了 有 力 手 段 .下 
面 以 离子 选择 性 电极 两 次 加 入 法 为 例 来 加 以 由 体 说 明 。 

不 少 评论 家 认为 这 一 方法 误差 太 大 。 此 法 的 要 点 是 ARERR TERNERA MUR 
Toa ORE с) 的 试 液 


E= E. тзв) (8-10) 
作 标准 加 入 ,使 <: 增加 AQ 及 ae*， 每 次 加 入 后 测试 电位 值 : 

E, =E, slg, + Ac.) (D 

E,—E,slgCc,r Aci des) (8-12) 


已 G=1，2) 为 测 得 的 电位 值 ，E, 是 电极 标准 电位 ，* 是 电极 的 斜率 . 合并 (8—10) ~ (8 12) 
zx. 得 
(E,—E)plg[( tae) e] (E, Ey gL © +e A60 /6,]—0 (8-13) 

X (8-13) 式 难于 求 得 的 显 式 解 , MA Monte Carlo 模拟 法 对 此 式 进 行 考察 。 作 标准 加 入 
测定 时 ,标准 液 浓 度 的 误差 、 容 器 误差 等 实验 误差 及 量 测 En E E 的 测试 误差 , 均 会 影响 
分 析 结 果 。 现 分 成 几 步 一 一 模拟 。 

D de. 产生 正 态 分 布 的 随机 数 《AcDw 及 《Ac:)、， 令 其 均值 相应 为 Ac 、Ac:， 相 对 标 
准 差 为 RSDs。， 此 相对 标准 差 表 征 了 Ac, 的 误差 ， 主 要 由 容器 误差 造成 。 

O 用 设 定 的 <; 和 随机 产生 的 正 态 分 布 的 随机 数 (Ac), 及 Bead 借 前 述 式 子 计算 En 
Ey, Е,, Wok, Eo 是 对 应 于 给 定 的 с, 值 的 理论 电位 值 , ME, E, ARGS Ac 及 Ас; 的 误差 。 
由 此 计算 得 到 的 E.. E E, 供 下 一 步 模拟 使 用 。 

图 产生 正 态 分 布 的 随机 数 (Eo)x、(E1) 及 (E,)s. 令 其 均值 相应 为 前 一 步 计算 的 Eo En 
EE,, 标 准 差 为 oc。 这 里 ,为 了 简化 模拟 , 设 所 有 电位 量 测 误差 ve 相同 ,但 也 可 在 模拟 时 给 定 不 同 
的 or PLA ALM Z, 时 ,浓度 较量 测 E E: 时 低 ,可 能 E. 的 量 测 相对 误差 较 大 。 

注意 回 ~ 国 步 模 拟 了 Ac 的 误差 传递 到 E LE, 又 有 本 身 误差 1ac; LUE PE E E: 又 
有 其 本 身 误差 ,下 一 步 将 传递 到 计算 上 去 。 

D WUE vy Edw B Edw RAR (8-13) HIER E Е. E, Ë, JE да Ac; 的 标 称 值 
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RA (8-13) 式 中 ,用 Newton-Raphson 法 求解 (8 13) Ж. 这 一 步 模拟 得 到 的 是 (c.)s。 这 里 
Aci Җ Ас, 用 的 是 实验 中 所 取 的 标 称 值 ， 而 不 是 加 入 了 误差 的 模拟 值 , 这 是 因为 在 实际 的 二 次 
标准 加 入 法 计算 中 就 是 这 样 作 的 。 

© 将 名 ~ 加 步 重复 多 次 ,例如 500 次 ,计算 «су 的 相对 标准 差 RSD。 所 得 的 500 个 数 
ЗЕТА ШОЕ), Eor, Edy Жс» BASEL. Glos, Cos, Es 自然 是 服从 正 态 分 
LEE 模拟 结果 表明 , (со, TYE AR AA TEAS GAB AY RU cy с HARE RSD. 0. 194. 
电位 量 测 误差 0 ImV， 取 未 知 浓度 为 =10.0, ла 10.0. 0140.0. 得 RSD=3.34, R 
较 大 的 Доле, 与 Де / Sc 值 可 增加 精密 度 ， d c, 的 相对 标准 差 RSD 最 低 可 达 1.5%. 但 用 这 
一 方法 有 一 定 眼 度 , Acl 取得 过 大 ， 将 使 二 次 标准 加 入 法 的 ~ 些 基本 前 提 不 再 成 立 ， 这 
AREMA Ber Ae 后 体系 的 离子 强度 等 条 件 无 显著 变化 、 疯子 活 度 系 数 及 电极 的 参量 已 、 
S 无 变化 。 

Monte Carlo 方法 不 仅 可 用 于 化 学 景 测 误 状 的 模拟 , 它 还 可 用 于 许多 化 学 计量 学 算法 
本 身 特 性 的 考察 ， 目 前 很 多 新 方法 的 发 展 大 都 需 用 Monte Carlo 法 先进 行 模拟 研究 的 原 
因 就 在 于 此 。 用 Monte Carlo 模拟 方法 研究 因 子 分 析 中 主 成 分 数 的 一 些 判 别 标准 的 特性 
058—077. A Monte Carlo 方法 及 其 应 用 的 详细 介绍 ,可 参阅 文献 1153, 该 书 对 此 
给 出 了 很 好 的 阐述 。 


第 二 节 基于 微分 方程 数字 解法 的 计算 机 模拟 方法 


一 化 学 动力 学 系统 的 微分 方程 数字 解法 


一 个 化 学 体系 的 动力 学 特征 一 般 都 可 由 一 组 常 微分 方程 来 表征 ， 所 以 ， 如 果 需 深入 了 解 
这 个 化 学 体系 的 动态 过 程 ， 一 般 是 对 该 常 微分 方程 组 直接 求解 。 然 而 ， 能 精确 求解 的 微分 方 
程 是 塞 密 无 几 的 ， 所 以 我 们 常常 希望 求 近似 的 数值 解 。 本 节 将 介绍 的 就 是 这 样 一 些 常用 的 数 
值 求解 常 微分 方程 的 方法 。 这 些 方法 的 基本 思路 是 将 时 间 变 量 离散 化 ， 即 产生 一 离散 点 序列 
及 变量 区 间 A = h. RE, ALL, 处， 用 先前 求 得 的 值 计 算 ， 
并 用 该 计算 值 作 为 该 时 间 点 解 的 近似 值 。 这 样 的 方法 在 微分 方程 数值 解 方法 中 称 为 逐步 法 
‘也 称 差分 法 或 离散 变量 法 )。 差分 法 提供 了 一 个 利用 个 先前 得 到 的 数值 yas у, улл. 
Pe KHP y. 1 的 法 则 ， 称 为 步 法 。 如 果 二 1， 则 是 单 步 法 ， 如 果 >1， 则 是 多 步 法 。 

欧 拉 法 是 最 简单 的 单 步 法 。 在 欧 拉 法 中 ， 2-! 的 值 由 前 一 点 的 值 y, ЖЕ ЖЕ. ЖЕ 
单个 方程 

dy/dt=y = f(y.t) 
BBE уб =y BE, yGOBYHIR y, 就 可 以 利用 уо Hb ERRAR SE NY A 
两 项 求 得 ， 即 
yy = yeh f (yo ste) 
RE. Фа=л-+А,, HR 
yGOR yim у Fhi Суу, ) 
按 此 法 则 继续 下 去 。 于 是 ， 一 般 形 式 有 
Vari Syn Faf yasta) 

然而 ， 尽 管 求 常 微分 方程 的 数值 解 的 方法 很 多 ， 但 它们 通常 都 能 时 人 以 下 介绍 的 方法 中 

的 一 种 。 下 面 ， 将 对 常用 的 微分 方程 数值 解法 以 其 不 同 特性 为 线索 加 以 简要 介绍 ， 


384 


(一 ) 台 劳 级 数 法 
如 果 解 y() 是 光滑 的 ， 那 么 它 就 具有 以 下 的 台 劳 级 数 展开 式 : 
GR) m y led +hdy ‘det Ch /2 dy 42) (8-14) 

前 述 的 欧 拉 水 可 以 看 做 为 一 种 取 台 劳 级 数 前 两 项 的 近似 方法 。 如 果 能 求 得 y 的 高 阶 导 数 , 即 
2 十 DA31 二 RAT (8-15) 
SOP yh у, 及 у” SP SFE A 80638 OO TESTÉ » 个 离散 点 时 的 -- 阶 ,二 阶 及 pp 阶 导 数 ,那么 , 利 
用 上 式 就 可 以 得 到 阶 方法 。 局 部 离散 误差 可 以 根据 会 去 的 第 一 项 来 人 i 汗 ， 步 长 也 可 由 此 选 
定 。 对 于 光滑 可 微 解 函 数 ， 台 劳 级 数 方 法 一 般 说 来 是 很 有 效 的 . 

C) 龙 格 - 库 增 法 

龙 格 - 库 塔 法 (Runge-Kutta Method) 为 近似 的 台 劳 级 数 法 , 它 只 需 知道 一 阶 导数 而 勿 需 
明确 定义 或 计算 其 他 阶 导数 。 近似值 由 车 下 次 苯 数 求 值 得 到 。 经 典 的 四 阶 龙 格 - 库 塔 法 由 (8- 
16) 式 给 出 : 


ya A= pat 1/6[ko~ 2k- +2k:—k.] (8 16) 
Жү 
ko 5AF Сулу) 
k,—hf Gy, 12h. t, HIA) 
kahf (yat 1/ 2k: sta 1/25) 
k. =hF Oa host =A) 
注意 ， 对 于 每 一 步 必须 求 函 数 f(y,t) 的 值 4 次 。 
当 h0 时 ,经典 的 四 阶 龙 格 - 库 塔 法 通过 阶 为 h' 的 各 项 渐 近 地 与 台 劳 级 数 法 相 吻合 。 然 
而 , 没有 任何 对 局 部 离散 误差 的 估计 来 确定 步 长 。 龙 格 . 库 塔 凌 有 几 个 优点 。 它 编程 容易 且 对 
很 大 一 类 问题 数值 计算 稳定 。 因 为 该 法 只 需要 一 个 解 y. 就 能 算出 w+:， 所 以 这 种 方法 能 自动 
ЖЭР, 步 长 在 计算 过 程 的 每 一 步 都 可 改变 。 对 于 用 格 - 库 塔 法 曾 有 过 不 少 改 进 . 以 提高 其 精 
度 ， 在 此 介绍 一 个 五 阶 方法 。 
五 阶 龙 格 - 库 塔 法 的 计算 公式 : 
Yum h/192[ 23k - 12543 —81k-+ 125k, | (8-17) 


к= feu) 
k= РО, БАЗА te E A3) 
ka= f Cyn -h/281 Al t 6ko letat 2A 5) 
kom бу. thd Alki 125 ks ] mh) 
k= f(y,-+h/81[ 6k H 90k: — 50k; +8k. sta 25/21 
k= f(y. HA/T5C6ki + 368; + 108, + BE ] t, 48/52 
(=) SHR 
上 述 所 讨论 的 方法 都 是 仅 通过 取决 于 志 ， y, MK, 的 函数 来 计算 y,_! 值 的 . 显然 ， 若 
利用 先前 求 得 的 点 的 信息 ， 即 uc. у, se c Mae Foe Saz 和 …， 应 可 以 得 到 更 
好 的 精度 (在 此 , f(y, 四 二 dy/dz 二 y )。 基 于 这 种 想法 的 多 步 法 是 非常 有 效 的 。 相 对 于 单 步 法 
来 说 , 当 要 求 精度 高 时 , 它 常常 内 需要 较 小 的 工作 量 ,而 及 很 容易 获得 截 尾 误差 的 估计 ,如 果 程 
序 设计 的 恰当 ,合理 ,那么 多 步 法 能 够 不 改变 有 值 而 在 任意 点 有 效 地 输出 结果 。 这 一 方法 的 阶 
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些 多 步 法 来 处 理 , 多 步 法 还 能 对 方程 自动 地 进行 刚性 与 非 刚性 分 类 。 然 而 ,得 到 这 些 优点 是 以 
程序 的 复杂 性 和 在 某 些 悄 况 下 数值 上 不 稳定 为 代价 的 。 

线性 多 步 法 可 以 认为 是 下 述 公式 (8 18) 


А А 
у, = Уа L ЁЛ. (§-18) 
a = 


的 特殊 情况 。 这 里, 是 一 个 确定 的 整数 ,a 或 8 不 为 0, 该 式 (8-18) 定 义 了 一 般 线性 下 步 法 .这 
一 方法 之 所 以 称 为 线性 的 .是 因为 上 面 的 多 步 法 公式 是 А 的 线性 函数 .而 f 本 身 则 可 能 是 也 
可 能 不 是 它 的 白 变 基 的 线性 函数 。 

在 这 个 方法 “启动 "以 后 ,每 一 步 都 根据 已 知 值 yy cem Sieh eefa so 
-th 来 计算 у ИН, А 如一 0, 则 这 种 方法 是 一 种 显 式 方法 ,计算 是 直接 的 。 A 3,5580. 
这 种 方法 是 一 种 隐 式 方法 ,因为 它 需要 大, ;的 值 方 能 得 y,.,。 如 隐 式 具有 更 多 的 所 和 要 求 的 特 
性 ,因而 应 用 隐 式 方法 时 存在 较 大 的 困难 也 是 理所当然 的 ， 

通常 .在 求解 的 每 一 步 都 使 用 两 种 多 步 法 。 首 先 使 用 显 式 法 进行 预报 ,然后 再 运用 -次 或 
多 次 隐 式 法 如 以 校正 一 因此 被 称 为 顶 报 -校正 法 预报 -校正 法 的 一 个 很 好 的 例子 是 四 阶 
Adams #7", 

预报 : Yan = et h/2A[55F, 597, ;37f.. —9f,-.J (8-19) 

校正 ， у А249, 19, 5А. 2] (8.20) 
式 (8-19), 式 (8-20) 两 个 公式 都 是 四 阶 的 。 由 于 多 步 法 需 运 用 前 几 个 计算 值 才能 进行 计算 ,所 
以 ,在 实际 编程 时 ， 大 都 采用 龙 格 - 库 塔 法 起 步 , 计算 三 步 后 ,再 采用 上 述 两 个 公式 进行 多 步 
法 计算 。 

另 一 个 多 步 法 的 例子 是 定 步 长 喻 明 (Hamming) 方法 于、 其 计算 公式 如 下 ， 

Yami Cre FOZ prei Hena] (8-21) 


式 中 
Puri = nea EPA 
¿a =1/819y,— y, +-ЕЗА_ Рб z 2F.— fli 
ra Poti F112/121[p,—c,] 
jel Adams 法 ， 也 可 采用 龙 格 - 库 塔 法 起 步 ， 计算 三 步 后 、 再 采用 上 述 公式 8-21) 进行 多 
步 法 计算 。 
Срд) 刚性 方程 的 吉尔 法 (Gear Mehtod for Stiff Equation) 
刚性 方程 是 一 类 很 特殊 的 微分 方程 ， 因 其 很 难 用 一 般 的 微分 方程 的 数值 解法 来 解 ， 故 一 
直 是 微分 方程 解法 研究 的 一 个 重点 问题 ， 有 效 的 方法 还 推 Gear 法 09) 。 对 子 方程 组 
y =4y/d= fG.y)= f (8-22) 


AP 
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fi 
f 
f= : 
Ж 
ШЖ] ЖИН 80 A BJ Fa GE PE ӨЛГЕ Ә//Әу 的 特征 值 肌 关 ， 例 如 ,考察 
f; — dy, /dt —998y,—1998y. (8-23a) 
fi==dy/dt=—999y, 19995. (8-23b) 
Ju SERT Ee REA OF /Oy 为 
aray- [227  Ә//ду.\ . 998 1998, , 
Uf /8y- [а/./Ә Әғ./Әу, T. -999 —1999! (8-24) 
它 的 特征 值 是 一 1 和 一 1000。 如 果 %(0) 一 (0)=1, 则 此 微分 方程 组 (8-23) 的 解析 解 为 
y=4e t des 
ys-—de7cde UU 
即 经 过 一 段 很 短 的 时 间 后 , 解 就 非常 接近 于 
у= 4с7' 
у= —2e ' 


ШЕКТ О 0 в, уе "9, = —2e ^" 两 个 解 都 接近 于 零 了 。 可 是 如 果 采 用 欧 拉 法 解 微 
分 方程 组 (8-23), 则 其 离散 解 可 写成 
Yurti = Уа ACO98 yi, d- 19982 
sati m yeah С 999 a 71999 2. 
Е ЖА y (0m (00 1.8 =). 01, UCET 
Xi 712-0. 01(9984-1998) = 30. 96 
y1 =1 +0. 01(—999-— 1999) =~ 28. 98 
AREAS ILE. RAR AO. БЫ]. ELSU A TS RE 
但 最 终 将 由 于 伟人 和 截断 误差 的 充分 积累 而 得 到 另 -- 种 不 稳 的 结果 。 因 此 ， 前 述 的 大 多 数 标 
准 方法 都 不 太 适 合 解 刚 性 方程 。 
可 是 ,在 化 学 动力 学 的 研究 中 ， 很 多 微分 方程 还 属于 刚性 方程 的 范畴 ， 如 一 些 含有 自 催 
化 过 程 的 复杂 反应 、 化 学 振荡 反应 等 ， 其 微分 方程 组 大 都 属于 刚性 方程 之 列 ”所 以 ， 关 于 
刚性 方程 的 数值 解法 还 有 必要 在 此 介绍 。 
EMR (8-220 所 未 的 常 微 分 方程 组 的 初 值 问题 ， 记 
一 [DJ 
可 知 Z, 是 一 个 (g 十 1) Xn 的 矩阵 。 
对 于 Adams 预 估 - 校 正方 法 的 计算 公式 为 


Zi) = PZ, (8-252) 
Zi = PLP, —d[h f Cayo PAS rr Gn1.2,7, M) (8-25b) 
Zia = PEN, (8-250) 


在 此 ，P 是 (8 十 1)X G+ BARE Pascal) = f8 e Be RTEKA 
p = C: qS, = 
МКК, АНЗ. Аа 
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d— [didis d, ] 
Е BUR ЖИЫ, ERI EI e m А Fel 
HF [Af Cte yl Dhf yi T Ж - O00 ERE I BS BEDA dU Af Gus yi" — hS ee 
yi] 就 图 一 个 (十 1) Xn КИШ. 


对 于 网 | 性 方法 的 计算 公式 为 
Zi), — PZ, (8-26a) 
ZP = PL d GRS yi aS ayer) (m=1.2,3,-. M) (8-26b) 
Z. PZ C8-26c) 


但 是 , God —4.(Əf/0y)] ! JB E93 aX PE (RB CO /2) EXE TERR EE, X 
Gear 方法 的 Fortran 于 程序 可 参阅 文献 55] 。 


二 、 电 化 学 过 程 的 数字 模拟 


电化 学 包括 电 分 析 化 学 中 的 许多 复杂 电极 过 程 是 数字 模拟 的 研究 对 象 ， 用 模拟 方法 研究 
电化 学 传输 过 程 已 有 较 长 的 历史 。 电 化 学 传输 过 程 中 涉及 的 最 基本 的 关系 式 是 Fick 第 二 定律 
表述 的 扩散 方程 ， 

Bef dt = Пд rO. (8-27) 

Aq. ARE, z 为 位 移 。 

(8-27) RÆ Fourier 研究 的 热传导 方程 的 一 个 应 用 方面 , 是 抛物 型 的 二 阶 偏 微分 方程 .由 
于 电化 学 过 程 中 还 涉及 对 流 、 均 相 的 或 非 均 相 的 化 学 反应 等 引起 的 浓度 变化 的 复杂 因素 ， 用 
解析 法 来 求解 得 到 的 偏 微分 方程 极为 困难 ， 所 以 ， 数 字模 拟 是 获取 答案 的 重要 方法 。 解 这 类 
描述 电化 学 过 程 的 偏 微分 方程 一 个 基本 的 方法 是 有 限 差分 法 。Feidberg 等 最 星 研 究 用 计算 机 
进行 电化 学 过 程 的 数字 模拟 5 ， 他 撰写 的 有 关 “ 数 字模 拟 ”一 解 电 化 学 扩散 动力 学 问题 的 通 
用 解法 ”论文 ,是 这 一 领域 的 经 典 著作 。 椒 节 将 简介 Feldberg 提出 的 “ 箱 法 ”及 Brite 发 
Ril AR” MA, 本 节 的 叙述 只 介绍 有 关 方法 的 基本 思路 , 对 于 一 些 细节 , 可 参阅 Britz 8 
写 的 有 关 电 化 学 中 数字 模拟 的 专著 5 。 

对 电化 学 过 程 考察 式 (8-27), 首先 涉及 的 问题 是 以 电极 表 而 为 起 点 , 计算 溶液 中 距 上 电极 
RIBUS HE BS oc 处 在 给 定时 间 :时 有 关 物质 的 浓 座 。 由 于 用 解析 方法 求解 有 关 偏 微分 方程 的 
困难 ， 试 模拟 物质 由 电极 表 而 到 溶液 中 的 实际 扩散 等 过 程 。 这 里 将 以 坐标 表述 空间 ， 高 散 
为 长 度 志 的 小 区 间 , 时间 坐标 : 则 离散 为 长 度 亲 的 小 区 间 , 即 式 C8-27) 中 的 工 与 + 相应 议 A 及 
Ot 的 倍数 表述 : 


wih 
t=i61 

如 绘 出 二 图， 图 上 各 代表 浓度 < 值 的 点 移 成 -- 个 网络 (图 8-2)。 

考察 图 8-2 中 标 出 的 点 , 所 请 数字 模拟 问题 就 是 找 出 每 一 时 间 间 隔 Ot 下 沿 z 轴 的 浓度 系 
Bl). Feldberg” 研究 的 方法 的 基本 思路 , 是 设想 从 一 维 方向 观察 一 很 细 的 洲 液 体 , 其 截面 积 为 
A. LS A RATES FA" Ый, 如 图 8-3 所 示 。 试 考察 3 个 相 邻 的 “ 箱 ” 单 元 , i 一 1， 
i, i 十 1。 在 时 间 间 隔 6t， 有 溶质 由 :一 1 单元 流入 i. 同时 也 有 溶质 由 i 流出， 进 入 i 十 1 单元 ， 
tk Fick 第 一 定律 , 沿 观测 方向 = 洲 质 扩散 通过 截面 各 了 4 的 通 量 7. (mol +s OWE RRA 
浓度 梯度 的 负 值 成 正比 ， 
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图 8-2 空间 与 时 间 离 散 网 点 示意 图 


UE - f =dn/dt=— АРӘс/Әх (8-28) 
ruas җир sn ELU Ч u ER ИИ RED ЭЖ 
ЭЕ RS 


图 8-3 离散 的 “第 ”单元 对 于 图 8-2 所 示 的 “ 箱 "单元 ,一 1 两 个 单元 
之 问 的 浓度 梯度 3c/8x 可 以 (ec 一 < 0/5 代替 ,同样 的 情况 适 内 于 1i 1 两 个 单元 , 故 有 
P= AD Ge, 000] 
f,=—AD (6, eh] 


流入 单元 i 的 净 通 量 为 
f=f,— f, 
故 在 Oe Н] A ui Ao COPA V OTHER TUE h Е 
n= fot 
де, —n/V,— (fot) / CAA) = [CAD80 / CAR) Ji (eo: — 2er te.) А] 
= 0092) А) [Ce 72676) /h] 
即时 间 а: 后 ，i 单元 中 浓度 为 
ci =a HEDE (2) (ea 726 76.) (8-29) 
用 i 单元 新 的 浓度 值 ef， 可 进而 处 理 ;十 1 单元 ， 如 a 
此 美 扒 。 只 旦 对 于 直 楼 与 电极 表面 搂 触 的 单元 ， 情 | 
况 稍 有 不 同 《 即 微分 方程 的 边 值 问题 ), 设 直接 与 电 MM 
极 接触 处 浓度 为 ce。( 参 见 图 8-4)， 这 里 讨论 的 各 单 Bet 与 电极 表面 接触 处 的 “ 箱 ” 单 元 
元 中 的 6 均 是 指 其 中 心 点 的 浓度 ， 而 сз 与 电极 -溶液 界面 处 co 之 间 浓 度 的 梯度 为 
(Әсл), = (с e / (h /2) 


因而 
fi —ADUG od hD 
Se 仍 如 前 表述 
fi —AD[G =] 
кн 


cie LGSO / (7) ](Go 7306 6) (8-30) 
上 面 就 是 “ 箱 ” 法 的 最 基本 部 分 。 这 种 算法 十 分 直观 ,体现 了 在 计算 机 上 将 溶液 离散 化 逐 段 
模拟 的 过 程 。 其 实 ， 进 行 这 种 模拟 并 不 一 定 需要 人 为 地 设想 这 种 “ 箱 ” 单 元 ， 而 可 直接 采用 
一 般 的 算法 ,事实 上 ,如 有 y 作 为 z 的 函数 (图 38-5), 设 需要 计算 等 距离 的 对 应 于 坐标 zx、> 的 
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分 《dyydr)， 可 每 出 

(dy/dx) gg бу». — YR 
或 

(dy/dr);s=(y— y VA 
或 (dy/dr)..= Oi y )(2h) 
对 于 二 阶 微分 

уй ау) nw — (ду, dics J/h 
=(y- 2y, `y) hŠ 

现 从 Fick 第 二 定律 出 发 ， 考 察 图 8-2 的 网 格 上 的 三 点 6-,， 26. coco EG. 将 式 (8- 
27) 离散 化 ， 即 以 相应 差分 公式 代替 微分 ， 左 边 简 写成 


(Oe Әг); — (с —e M (88) (8-31) 
而 对 右边 则 有 
DE e/a) = (DIR Ve, .— 2e,— 64) (8-32) 
FF (8-31), (8-32) PER ,得 
Gl 1) 080) = Dh Ye — Pe, Бе.) (8-33) 
亦 即 
c Se, + [Dba Ко 一 2 十 c )=c AG. 7266) (8-34) 


比较 式 (8-34) 与 式 (8-30), ERLE BLA, ШЖ A CR AUR "R 单元 ,可 得 到 相同 的 结果 。 
上 面 通过 对 最 简单 的 扩散 过 程 的 数字 模拟 
解释 了 有 关 算法 的 基本 思路 。 从 这 一 基本 思路 出 | 
发 ,可 以 构造 较 复杂 的 系统 的 模拟 算法 ,如 可 模拟 
滴 示 电 极 球形 表面 的 扩散 过 程 等 。 上 述 模 拟 中 的 。 | 
А, 即 CCD84)/h*]， 是 一 个 很 重要 的 景 ,对 模拟 过 
程 十 分 重要 。 设 计 宽 拟 算法 时 ， 需 控制 取 刻 ,37 的 
值 , 使 得 20.5. й 220.5, MHRA MT 
я “Жый”, 无 法 反映 扩散 过 程 的 实际 情况 。 这 可 | 


理解 为 在 给 定 的 品 与 & F, 0r 的 选取 受到 限制 ， 
只 有 在 较 小 的 Oc 下 才能 假定 可 用 线性 关系 描述 
扩散 过 程 . 如 再 考察 式 (8-34)， 即 

ce =e, FAC etem) 

这 个 式 子 表述 了 c 值 是 由 c, 值 加 右边 的 另 
一 项 而 得 这 一 项 中 的 c-，、c ca BAWERA. HAREN e MWA 

ei =e, te. AG а beni 26. > деса Бел) 

如 设想 对 所 有 i 一 1 .i\i 十 1 的 误差 均 为 c, 则 误差 大 部 分 抵 销 ,不 臻 因 传递 而 放大 。 但 实际 
情况 难 满 耻 这 一 条 件 , 如 设 各 绝对 值 相同 ,符号 有 正 有 负 , 考虑 最 坏 情 况 , 令 c-i\c+: 的 误差 
AE M c 的 误差 为 负 , 则 有 

с=с, Ale, :一 2c 十 c 十 (4 一 1)e (8-35) 
зб (8-35) ARR c 的 真 值 ,最 后 一 项 是 模拟 过 程 引 人 的 误差 。 从 式 (8-35) 可 以 看 


图 8-5 “点 ” 式 离散 过 程 
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出 ,4>0.5 时 ,误差 将 被 放大 。 

在 模拟 电化 学 过 程 时 ,常常 癌 一 形式 的 曲线 需 反复 近代 计算 ,为 使 这 种 计算 不 致 于 每 次 由 
于 数值 变化 归 重 复 进 行 ,可 将 模拟 单位 无 央 次 化 ”即将 各 物理 芋 变 换 为 某 种 参 比 值 的 倍数 ， 
例如 时 间 以 某 种 实验 观测 时 间 z 作 参 比 ,变换 为 


T—nr 
距离 则 变换 为 
入 = 
9 Xj Nernst 扩散 层 厚 度 
= vrir 


关于 Nernst 扩散 层 厚 度 的 涵义 ,这 里 可 设想 洲 液 (本 体 浓度 ..) 与 电极 表面 接触 ,接触 处 发 生 
电化 学 过 程 .物质 耗 尽 < 一 0, 则 在 这 个 接触 处 与 溶 波 本 体 之 问 将 发 生 浓度 差 梯度 ,扩散 过 程 将 
使 本 体 溶液 中 物质 向 电极 表面 转移 ,实际 1, 只 在 归 电 极 表 徊 儿 个 5 厚度 处 ,有 这 种 浓度 梯度 
变化 存在 ,距离 更 远 时 浓度 均等 于 本 体 浓度 con 

如 将 浓度 c 必 无 关 次 化 ,使 之 为 

Сее 
代 人 式 (8-27), 将 得 到 
C/T — O0 /w)9 CioX* (8-36) 

如 取 6= VDr, 则 式 (8-36) 中 的 x 亦 呆 消去 ,用 这 样 的 办 法 进行 模拟 ,可 显著 缩短 计算 
机 时 。 

实际 的 电化 学 过 程 有 许多 因素 要 加 以 考虑 。 除 扩散 以 外 .有 对 流 、 迁 移 等 过 程 ,有 均 相 的 与 
非 均 相 的 化 学 反应 动力 因素 、 吸 附 动力 学 因素 等 。 模 拟 要 状 虑 边界 条 件 ,控制 电流 或 电位 下 的 
可 递 及 准 可 逆 体 系 、 多 步 反 应 等 ,条 件 各 不 相同 ,这 些 体系 的 数字 模拟 问 砷 已 基本 上 得 到 解决 。 
现代 计算 机 数值 方法 还 为 电化 学 过 程 的 模拟 提供 了 工具 . 进行 电化 学 过 程 数 字模 拟 最 关键 的 
问题 是 电化 学 体系 的 数学 描述 ,可 参阅 有 关 电 化 学 及 电 分析 化 学 专著 *“, 例如 ,在 作者 实验 
宣 进 行 了 新 合成 的 电 分 析 试 剂 的 电极 过 程 研 究 -*。 数字 模拟 用 于 电化 学 研究 的 另 一 个 实例 是 
离子 选择 性 电极 膜 电化 学 过 程 的 模拟 ,例如 中 性 载体 电极 响应 机 理 的 数字 模拟 研究 ,对 于 新 合 
成 制备 的 基于 主 - 客 配合 物 反 应 的 伯 胺 电极 ,用 数字 模拟 方法 探讨 了 各 种 实验 因素 对 电极 性 能 
的 影响 ,并 将 它 与 实验 结果 进行 了 比较 ,以 阔 明 有 关 响 应 机 再"1。 
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BAR ”化 学 构 效 关系 的 研究 方法 


定量 结构 活性 关系 研究 (QSAR) 和 定量 结构 性 质 关系 研究 (QSPR), 这 两 种 定量 构 效 关 
系 钙 究 现 已 成 为 化 学 计量 学 研究 的 一 个 十 分 重要 的 分 支 .化 学 计量 学 的 发 展 ， 将 QSAR 和 
QSPR 的 研究 又 提高 到 了 一 个 新 的 水 平 , 近 年 来 得 到 了 很 快 的 发 展 . 大 最 的 研究 文章 已 在 日 前 
很 多 重要 的 国际 刊物 发 表 ， 这 些 刊 物 包括 美国 的 “分 析 化 学 ”(Analytieal Chemistry)、《 医 药 
化 学 杂志 》 (J. Medicinal Chemistry)、《 应 用 毒物 学 基础 》 (Fundamentals of Applied 
Toxicology)、《 药 物 信息 杂志 》(Drug Information Journal), (Ж #802) (Environmental 
Health Perspectives) 《药物 科学 杂志 》(Journal of Pharmaceutical Science) 等 , 此 外 , 存 1982 年 
一 本 专门 介绍 定量 构 效 关系 的 杂志 -一 Quanntative Structure-Activity Relationship 也 已 
问世 。 

HR, ARRAN TMS EA DERE. ALR EMS HT (CAOC》 这 一 研究 领 
域 就 可 看 成 是 定 景 构 效 关系 研究 的 前 身 ，Hammett 在 其 经 典 著作 “中 提出 线性 自由 能 关系 
(LFER) 可 认 作 QSAR 和 QSPR 的 起 点 。 当 时 只 大 少 部 分 的 化 学 参数 可 以 数量 化 , 如 取代 基 
的 电子 效应 (Hammett 的 = 常数 ), 立体 参数 Taft BBO 以 及 踊 水 性 (Hansch 的 分 配 常数 )。 
Hansch'” 的 研究 也 就 是 将 这 些 化 学 性 质 建立 在 定量 研究 的 基础 之 FF， 他 主要 探讨 了 结构 变化 
与 生化 活性 之 间 的 关系 ,我 国 的 化 学 家 们 在 这 方面 也 做 了 大 量 工作 , 陈 荣 眉 等 中 发 展 了 配 位 化 
学 中 的 线性 自由 能 关系 的 研究 。 蒋 明 谦 系统 论述 了 有 机 化 合 物 的 同系 线性 规律 习 ， 徐 光纤 等 
探讨 了 这 类 规律 的 基 子 化 学 基础 六 。 在 有 关 物 理 有 机 化 学 溶剂 效应 研究 口 ， 刘 有 成 等 比较 了 
有 关 溶 剂 极 性 经 验 参 数 ””。 定 量 构 效 关系 的 研究 实际 上 是 涉及 到 了 化 学 学 科 一 个 带 根本 性 的 
问题 -一 如 何 从 物质 的 化 学 成 分 与 结构 定量 预测 其 化 学 特性 ? 量子 化 学 研究 的 一 个 重要 目的 
就 是 要 直接 从 微观 的 角度 来 回答 这 样 的 问题 。 对 于 -个 给 定 的 分 子 . 量子 化 学 通过 求解 相应 
的 Schrodinger 方程 , 求 出 相应 的 特征 值 和 特征 向 量 ， 可 措 绘 能 量 和 电子 的 分 布 , 分子 的 性 质 
可 从 波 画 数 与 能 量 导出 。 目 前 ， 量 子 化 学 已 取得 令 人 甩 目 的 成 就 ， 但 对 于 复杂 的 分 子 进行 量 
子 化 学 计算 尚 有 一 定 困难 。 由 子 这 一 原因 大量 的 化 学 研究 仍 处 于 一 种 “定性 ”的 水 平 。 而 
本 书 所 主要 论 及 的 定量 构 效 关系 则 是 从 宏观 的 角度 出 发 ， 直 接 从 试验 数据 或 某 些 量化 的 结构 
数据 出 发 ， 采 用 统计 学 和 模式 识别 的 方法 来 建立 起 某 些 化 学 结构 与 性 能 的 关系 。 

因 有 机 反应 性 相关 分 析 这 一 研究 领域 实际 可 看 成 是 定量 构 效 关系 研究 的 前 身 ， 所 以 本 章 
首先 将 对 有 机 反应 性 相关 分 析 这 一 研究 领域 进行 必要 的 介绍 ， 然后， 对 化 合 物 结构 的 数字 表 
征 方法 ， 如 拓扑 矩阵 、 分 子 连接 性 指数 等 ， 作 出 详细 地 介绍 ， 在 此 基础 上 ， 再 对 化 学 计量 学 
中 的 构 效 关系 建 模 方法 分 成 三 个 部 分 ， 即 基于 回归 分 析 的 建 模 方法 、 基 于 模式 识别 的 建 模 方 
法 和 人 工 神经 网 络 的 建 模 方法 分 别 给 出 详细 说 明 。 


第 一 节 有 机 反应 性 相关 分 析 方法 简介 


有 机 反应 性 相关 分 析 (CAOC) 这 一 研究 领域 主要 应 用 回归 分 析 方 法 来 寻找 有 机 反应 性 的 
数量 关系 。 历 史上 ， 线 忻 自由 能 关系 (FER 就 是 由 有 机 化 学 家 发 展 起 来 的 , 同时 他 们 还 提 
出 一 些 有 用 的 反应 参数 , 如 取代 基 的 电子 效应 《Hammett 的 o 常数 ), 立体 参数 (Taft SHS 
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BO 等 ， 本 节 对 这 些 肉 容 将 给 出 简要 介绍 ， 以 保持 定量 构 效 关系 这 一 内 容 的 完整 性 。 
一 、 线 性 自由 能 概念 及 其 经 典 Hammett o 常数 
对 于 热力 学 平衡 常数 开 ， 可 写 出 


AG" ERATE AEE IL, Mana, REM А 可 表示 为 
A 
此 方程 中 是 Boltzman 46386, AG" 是 标准 活化 自由 能 . 由 此 得 出 , 有 关 eK 或 lgk GES 
TO 的 关系 ， 实质 上 是 关于 自由 能 的 关系 ， 故 有 线性 自由 能 (РЕК) 之 称 。 
Hamnetti5 提 出 的 经 典 公式 ， 描 述 了 间 位 或 对 位 取代 薄 衍 生物 的 支 链 反 应 的 速度 常数 

RE RK 与 取代 常数 "、 反 应 常数 o 的 关系 : 

Igh, =Igk + po 

ЄК —lgK?-- po 
E, K 是 与 未 到 代 的 母 化 合 物性 质 有 关 的 常数 ， 取 代 常 数 = 表征 的 是 将 葵 环 上 的 氨 以 给 定 的 
间 位 或 对 位 取代 基 取 代 时 的 极 性 效应 , 原则 上 与 温度 、 溶 剂 介质 等 条 件 无 关 。 而 反应 常数 p 则 
与 这 些 条 件 有 关 。Hammett 选择 茶 甲 酸 在 25°C 时 在 水 中 的 电离 作为 参 比 反应 , EX om. 并 
定义 


Igk —lg т - 


o=I[g(K./K?) (9-1) 

AF, К, ВЖЕ Pa ZO К. SARS МОВЕ Be gt, eK So 之 间 有 
线性 关系 ， 这 就 是 经 典 的 LFER, 

不 同 其 团 在 间 位 Ge) 或 对 位 〈p) 的 = 值 示例 于 表 9-1”。 符 合 于 方程 (9-1) 的 构 效 关 

系 已 观察 到 差不多 有 数 百 种 中 .平衡 常数 和 速度 常数 都 符合 于 这 种 关 背 ,值得 注意 的 是 并 非 所 

有 的 化 合 物 系 列 在 o 和 lgk 或 lsK 间 均 能 获得 简单 的 线性 关系 。 此 外 ， 尽 管 上 述 关系 是 用 热力 


学 术语 加 以 叙述 的 〈AG sk lgK (Ë), 但 只 能 属于 超 热力 学 范畴 ,因为 无 法 用 热力 学 原理 来 阐 
述 这 些 关 系 是 真正 存在 的 。 
ROL ERREK otk 
取代 人 = | " BAN а. " 
Me —0.07 =0.16 OH 9:13 =0. 38 
Bu —0.10 ~ 0.20 OMe 0.11 - 0.28 
Ph 0-06 —0.0% DAC 0.39 0.31 
CF; 0.43 0.54 SH 0.25 9.15 
COMe 0.38 0.50 SMe 9.15 0. 00 
COH 0.37 0.45 SO, Me 0.60 0.72 
CN 0.61 0.70 F 9.94 0.06 
NH; 0.00 057 с 0.37 0.22 
NMe; 一 0.15 0.63 Br 0.39 0.22 
NO, 0.71 0.78 1 0.35 0.21 


二 、 取 代 共 电子 效应 常数 《o 常数 ) 的 应 用 与 拓展 


取代 基 的 电子 效应 常数 Co 常数 ) 对 线 伯 自由 能 类 型 的 构 效 关系 分 析 很 有 用 , 它 主要 是 为 
了 说 明 各 种 远程 取代 基于 分 子 某 部 分 的 反应 性 能 的 影响 。 
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(—) 芳香 系统 上 的 取代 基 

传统 的 Hammett 方程 由 式 (9-1) 给 出 ， 并 定义 了 芋 甲 酸 在 25°C 时 在 水 中 的 电离 的 等 
TOL 由 此 可 算出 其 他 一 些 反应 的 = 值 ( 表 9-2)。 表 的 上 半 部 分 表示 在 芳 环 和 反应 中 心 之 问 的 
次 甲 基 越 多 , 2 值 就 越 小 Co 值 衡量 反应 对 取代 基 影 响 的 敏感 程度 )。 表 的 下 部 分 表明 洲 剂 的 极 
性 变 小 ， 导 致 " 值 增 太 ， 这 种 溶剂 效应 尚 末 充 分 认识 :0 。 


X92 RRR Eh $| о 值 的 影响 


ГИ ЕЛЕГЕ ПЕС [е яая ¿6 
ЕНЕЛ | 7 ArCOOH RAM] 30 1.07 
ArCOOH * 25 | 1.00 ArCOOH ZE | 30 0.94 
ArCHeCOOH 水 25 0.49 ArCOOH 甲醇 30 0. 88 
ArCH —CHCOOHUR R) * 28 | бат ArCH--CHCOOHORSO | 2088 | 30 | 0.12 
ArSCH,COOH * 25 | 0.30 ArCH,COOH ГА | 36 0. 40 
ArSO,CH,COOH 水 25 0.28 ArOCH;COOH ZB w 02 
Ar(CH2:;COOH K z | ozi | ArCHaCOOH zm | x | 022 
LET RP ttg ш | |e ArCsH.COOH A | 30 | 0.22 
ArCOOH SIM) 50 | 128 f | 


Ж Hammett 方程 式 定义 后 森 久 ,发 现 某 些 基 团 或 母体 分 子 或 反应 需要 采用 特殊 的 o 值 。 
这 种 o 值 反映 了 取代 基 和 反应 部 位 间 直 接 共 轿 相 互 作用 的 影响 。 对 位 硝 基 使 酷 盐 稳 定 化 作用 
就 是 个 典型 例 于 (XW)， 然 而 ， 这 种 共 示 稳 定 化 在 对 硝 基 莱 甲 酸 盐 中 是 六 存在 的 《WD 。 
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Bu 
BEDAE ДЕЙК АЕ ЯП y rh ly t B SE ИЕ Bi 0553 1—Ж о (Е ЛЕБ pu pj ME SB he E 
正 性 中 心 时 , Bor 表示 对 位 取代 基 的 电子 常数 , ЙИШ, —OCH,, —CH;, —OH, —SCH;, Ё 
4138 x HEP DRAB: 反之 , 可 产生 负 性 中 心 的 反应 , 用 op 表示 取代 基 的 电 
子 和 常数 , 例如 ,对 位 取代 的 一 NO;, 一 CN, —COOH, 一 SONHa.。 其 他 取代 基 仍 用 原 值 表示 . 表 
9-3 列 出 了 常用 取代 基 的 o, of о, 值 。 


RIS 常用 取代 基 的 电子 参数 


BRE | o m a | è BRE m m | е 
н 0.00 0.00 0.00 0.00 | SO;CHs 0. 68 0.73 1.08 
F 0.34 0.15 — 0.07 一 0.02 | SCHs | 0.14 0.03 —90. 60 
с 0.47 0.23 0.11 COCH; 0. 36 0. 47 0. 87 
Br 0.37 9.26 9.15 COR 0.38 | 0.44 0.48 0. 68 
Me —0.06 —0.14 —0.31 C.H; 0.06 | —0.05 一 0. 17 
мн, 一 0.09 | 一 0.30 | -1.30 OC;H; | 0.25  —0608 | ~0. 50 
OH 0.02 — 0.22 —9892 5 CONH: 0.28 0. 35 0.62 
ксн 0.88 0.82 0. 41* | NO; 0.71 0. 81 0.79 1.24 
NCH): —0.10 | —o32 | —1.70 | cN 0. 62 0.71 9.66 0.90 
OCH; 0.10 | —0.12 | ~0.78 | 一 0.20 ||CFs 0. 46 0. 54 
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应 用 这 些 特殊 的 a 常数 所 过 到 的 问题 是 : 有 三 种 尺度 而 不 是 -- 种 。 在 实际 计算 中 , 不 可 能 
直 截 「 当 地 决定 用 哪 种 ， 物 理 有 机 化 学 家 对 此 有 所 考虑 ,许多 反应 需要 采用 正常 的 和 修正 值 
21160 018. 

(=) o 值 分 成 共振 成 分 和 诱导 成 分 

评价 共 堪 效应 在 反应 中 的 重要 性 的 - -个 方法 就 是 分 别 应 由 取代 基 的 共 元 效应 常数 或 称 
共振 效应 常数 ) 和 诱导 效应 常数 . Taft Lewis? 71958 年 提出 o 值 是 这 两 种 效应 的 线性 组 合 。 
根据 化 学 原理 ， 他 们 创立 了 a CURSO 和 on (共振) 值 表 。 这 样 ， 无 沦 对 于 哪 类 o 值 ， 愉 是 
FAH а, b RERA: 


0=aqt bon 
三 、 取 代 基 的 立体 效应 常数 


在 选用 各 种 参数 时 。 立 体 效应 参数 是 最 成 问题 的 。 这 是 因为 某 化 合 物 或 反应 的 立体 相互 
作用 难以 平移 到 男 一 化 合 物 或 反应 中 ， 而 月 ， 识 别 哪 种 立体 影响 是 重要 的 也 很 不 容易 。 下 曾 
介绍 两 种 立体 效应 常数 。 

《一 ) Тай 的 立体 参数 

基 团 立体 效应 的 经 典 线性 自由 能 度量 是 Taftt] 的 立体 参数 已 值 .到 的 定义 是 :在 相同 的 
溶剂 、 温 度 、 酸 度 下 ， 隔 基 取 代 的 乙酸 甲 酯 的 酸 催化 水 解 相 对 速度 与 乙酸 甲 酯 的 比值 的 对 数 

Е, =18К,сом —lgK uco, ue 

式 中 ,下 cw,m 是 被 取代 的 醇 的 水 解 速度 常数 ， 开 weco,ue 是 乙酸 甲 酯 的 水 解 速度 常数 。 因此, Hi 
基 是 基准 取代 基 ， 若 以 K 和 Ko 分 别 表示 取代 的 和 基准 化 合 物 的 速度 常数 ， 则 另 一 种 表达 式 
ШТ: 
E,=Ig|K/Ko!. (9-2) 
A. 下 标 a 指 酸 水 解 反应 。 
酸 催化 水 解 反 应 速度 是 否 仅 由 立体 效应 控制 ， 现 在 仍 有 不 少 争论 。 通 过 观测 发 现 如 下 基 
本 事实 : 茶 甲 酸 栈 闻 位 或 对 位 取代 基 几 乎 不 影响 酸 催化 水 解 反应 速度 ， 芝 甲酸 上 类 似 取 代 基 
也 不 影响 酸 催 化 水 解 反应 速度 。 而 这 类 取代 基 对 同样 化 合 物 的 碱 催 化 反应 速度 影响 却 很 大 。 
Hancock 等 中 认为 该 模 昼 是 受 超 共 恩 效 应 影响 的 ， 建 议 Е, 应 按 09-3) 式 加 以 修正 ， 

E}=E,+0. 306 (0—3) (9-3) 
ub. 是 和 氨 原 子 的 数目 。 这 一 论断 已 被 量子 化 学 计算 证 实 。 

许多 取代 基 的 TafcE, 值 是 不 能 测量 的 , RA E. 值 是 依 模型 反应 的 性 质 所 定 。 针对 这 个 问 
81, Charton? ffl Kutter 及 Hansch29 建 议 ， 对 于 球形 对 称 的 基 团 ， 可 用 半径 作为 立体 效应 的 
EE. E 和 半径 间 的 良好 相关 性 证 实 了 EE, 的 立体 性 质 。 利用 这 种 关系 , 已 经 计算 了 另外 一 些 
ae Е, fü. 

(=) Verloop 立体 参数 

Verloop 8&8 e 7 —Ж Жз kR ACE. EERI EEA AEEA T 
得 到 的 .已 经 发 表 了 243 个 取代 基 的 5 个 参数 , 第 一 个 参数 为 工 , 它 是 沿 取 代 基 和 母体 分 于 的 
键 轴 方向 上 的 取代 基 长 度 .垂直 于 该 键 轴 方向 又 量 测 出 4 个 参数 B — 5. В, 是 最 小 宽度 参数 ， 
B.~B 分 别 是 垂直 于 其 他 刀 的 距离 ， 且 依 值 的 大 小 递增 排列 。 故 工 和 有 吾 一 B, BETREE 
绕 基 团 的 5 个 平面 的 位 置 ， 这 些 位 置 与 连接 点 和 键 轴 有 关 。 

从 初步 应 用 看 来 ， 这 些 参数 在 构 效 关系 的 计算 中 是 非常 有 用 的 。 但 是 ， 是 否 5 个 参数 都 
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要 ， 尚 未 作 定论 。 表 9-4 引 摘 了 243 个 取代 基 的 Verloop 参数 供 读者 参考 。 
表 9-4 243 个 取代 基 的 Verloop 立体 参数 


= 取代 基 L.nm Bonm Beam Binm Binm 
1 H 0.206 0.100 0.100 0.100 0. 100 
2 F 0.265 9.135 0. 135 0.135 0,132 
3 © 0.352 0.180 0.180 0.180 0.186 
4 Br 0. 383 0.195 0.195 0.195 о. 195 
5 1 0.423 9.215 0.218 0.215 0.215 
6 9. 300 9.152 0.190 0.190 0.204 
? 0.411 0.152 0.150 9.180 0. 297 
8 0. 505 0.152 0.190 0.190 0.349 
9 0.41 0, 204 0.278 0. 316 0.316 
10 0.414 0. 198 0.224 0. 229 9.288 
11 0.617 0.152 0. 190 0.190 0. 442 
12 0. 505 0.152 0.190 0.316 0. 421 
13 0.505 0.190 0. 276 9.318 9.349 
и 9.411 2. 238 0. 286 0. 286 0. 297 
15 0. 469 0.195 0.264 0.264 0.383 
16 07H 0.182 0.190 0.196 0.494 
17 0.617 9.152 0.180 0. 316 0.442 
18 Сн‹Сгнуг 0, 473 0.211 0.259 0. 399 0.399 
19 e-C3Hy 0. 497 9.204 0. 286 0. 286 0. 398 
20 Же 0.822 0.152 0. 190 0. 190 0. 587 
21 C;H,C(CH;); 0.617 [3 0, 286 0. 286 0.442 
22 | CH;C(CH;);CIHs 0. 617 a 0.316 0. 316 0.442 
23 СН 0.617 0. 0.316 0.316 0, 349 
24 nC His 0.916 5. 0.190 0.190 0.639 
25 C(CHi;CCCH Os 0. 505 0.312 0.312 9.414 
26 Car 1.027 0.190 9.190 0.733 
2? п-СаН KEH) 0. 582 0.217 0.475 0. 685 
28 я-СыНь; 1.438 0.190 0.180 1.027 
29 a Cag Hos RERO 0.729 0.190 0. 466 0.939 
30 CH;F 0. 330 0.190 0.190 0.261 
3 CH;CI 0, 389 0.190 0.190 0.346 
a2 1 CHBr 0. 409 0.195 0.195 0.375 
3 | CHI 0. 436 0.215 0.215 0.415 
34 | снн 9. 397 0. 190 0.190 0.270 
35 CH;OCHs 0.491 0.190 0.190 0.288 
36 | снососн, 0. 546 0. 190 0.190 0,446 
a7 CHOC Hs 0.819 0. 309 0.311 0.311 
38 CH;SCH; 0.541 0.190 0.190 0.341 
39 CH;SO;CH« 0. 505 0.252 0.252 0.348 
40 CH;NHCHa 0. 496 0.190 0. 190 0.290 
41 CHN(CHs)z 0. 483 0. 280 0. 280 0. 342 
AZ CHAÑCH): 0. 496 0.280 0. 280 0. 394 
43 CH:NO; 0.370 0,244 0.244 0. 336 
m CHsCCH 0. 399 0.190 0.190 0.449 
45 CHACN 0. 399 0.190 0.190 0.412 
46 CH;CHCH, 0.511 0.180 0.190 0.378 
47 CHeCBrCH; 0. 416 0.312 0. 368 0.413 


BR 

号 R 代 基 L/nm Bi ‘nm Вита Bjnm Bi fnm 
48 CH,CF; 0.470 0. 244 0.244 0.345 
49 CH;COCH; 0.454 0.190 9.190 0. 439 
50 CH:COOCHs 0. 598 0.190 0.190 0. 428 
51 CHzCeHs 0.363 0.311 0.311 0. 602 
52 CH;G-CI;HU 0. 442 0.152 0.311 0.311 0.744 
53 CHzCONHCaHs 0.695 0,182 0,311 ъз 9. 722 
54 CHC 0.557 0.152 0.190 0.190 9. 325 
55 CBr 0.587 0.152 0.195 0.340 о. 340 
56 CHI 0. 628 0, 152 0.215 0.215 0. 360 
57 CHOH 0. 479 0.152 0.190 0.190 0. 338 
58 CHNO; 0. 549 0.152 0.244 0. 244 0. 298 
59 C;H,NCCH;): 0. 558 0.152 0. 280 0. 280 0. 297 
60 C4H,CN 0. 628 0.182 0. 190 0.190 9.305 
61 C;H,COOH 0. 596 0.152 0.235 0.267 0. 308 
62 C;H,CONH; | ови 0.152 0. 242 0. 297 0. 308 
63 CHCH; 1 0.833 0.152 0.311 0.311 0. 316 
64 CHF; | 0.330 0.171 0.175 0.226 0. 256 
65 сно, 0. 389 0. 204 0. 268 0.324 0. 324 
66 CHBr 9.409 0.204 9.285 0.350 0, 350 
67 CHFCI 0. 389 0.175 0, 228 0. 258 0. 339 
68 CHFBr 9-409 9.178 9.247 0.255 0. 368 
69 CHCIBr 0.409 0.190 0.275 0.346 0.356 
70 CHCICH, 0. 389 0.189 0. 258 0.287 0, 346 
"n CHBrCH; 0.409 0.193 0. 283 0.298 0. 352 
72 CHOHCH; 0.397 0.176 0.222 0.263 0. 309 
73 CHCH;NCCH;; 0. 429 0. 190 0. 305 0. 374 0. 424 
74 CHCH) 9.515 0.201 0,499 0.528 0. 582 
75 CEs о. 330 0.198 0.244 0.244 0.261 
76 CCh 0,389 0. 263 0. 324 0. 324 0. 346 
7 CBr; 0, 409 0. 286 0.350 0.350 0.375 
78 CFCF; 0,411 0.198 0. 244 0. 244 0. 364 
79 С‹СНз):СН:ОСНз 0. 555 0. 277 0. 316 0. 316 0. 449 
80 ССН), 0. 528 9.310 0.332 0.390 0.596 
m CCCeHs)s 0.515 9.484 0. 502 0.571 0.594 
82 CHCH; 0.429 0.160 0. 180 0. 200 0. 309 
83 CHCHCHsCE) 0.523 9.180 0.190 0. 200 0. 309 
84 CHCHCH:(Z) 0.429 0.190 0.190 0.200 0.403 
86 C(CHs)CH: 0.429 0.190 0.190 0.309 0.311 
86 CHCHCH(CH:)2 0. 635 0.190 0. 200 0.316 0. 406 
87 CHCHNO; 0.429 0.160 0. 183 0.324 0.421 
88 CHCHCOOH 0.615 0.160 0.183 0.251 0.311 
89 CHCHCOCH, 0. 580 0.160 5.183 0.324 0.373 
90 CHNOH(E) 0. 488 9.160 0.160 0.192 0. 31 
91 CHNOH(Z) 0.394 0.160 0.183 0.270 0. 356 
92 CHNCH(CH;); 0. 635 0.190 0. 200 0.316 0.406 
93 CHNNGH; 0.577 0.190 о. 200 0. 280 0. 417 
94 CHNCeHs 0.850 0.170 0.170 0.236 0. 407 
95 COH 0.353 5.160 0.180 0.200 0, 236 
96 COCH; 0.406 0.190 0.190 0.236 0. 293 
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BR 

编号 kR £X Linm By/nm Byam Bafom Beinm 
97 COCHICHD: — 0. 467 0. 236 0.316 0.316 0.369 
98 сосн, 0. 457 0.238 0. 8H 0.311 0.598 
99 COOH 0.381 0.160 0. 160 0. 236 о. 266 
100 COOCH; 0. 485 0.180 0. 190 0. 236 0.336 
101 COOC Hs 0. 596 0.19) 0.190 0. 236 0.429 
102 COOCH; 0. 690 0.190 0.190 0.236 0. 483 
103 CONH: 0, 406 0.160 0.160 0.242 0.307 
104 CONHCH, 0. 500 6. 165 0. 223 0. 242 0. 307 
108 CONHNH; 0. 492 0.160 0.195 0.242 0. 328 
106 CONCH): 0-461 0.19) о. 218 о. 353 0. 383 
107 CONCH;CONHCH; 0.461 0.181 0. 220 0.352 0.543 
108 CCH 0. 466 0.160 0.160 0.160 0. 160 
109 GCCeH5 0.888 0.170 0.170 о. зп 0.311 
110 CN 0. 423 2. 160 0.160 0.160 0, 160 
11 C.H; 0. 628 0,170 0.170 0.311 9.311 
12 £-CICUH, 0.774 0.180 0. 180 0.311 0.31 
113 OH 0.274 0. 138 0. 138 0.135 0.193 
na OCH: 0.398 0.138 0.190 0.190 0. 287 
115 OCH 0. 492 0.135 0.190 0.190 0. 336 
16 n-OC;H; 0. 605 0.135 0.190 0.190 0. 130 
117 EOGH? 0.459 0.135 0.190 0.316 0. 361 
118 cOCsHs 0.468 9.135 0.224 0. 229 0. 358 
119 "ОС,Н» 0.699 0.190 0.190 9,478 
120 0С. 0. 605 0.190 0.316 0.430 
121 5-OC,Hs 0. 608 0.190 0. 318 0. 430 
122 Осан, 0.492 0.286 0. 286 0.304 
125 OCH 0.81 0.190 0.190 0.573 
124 c-OCsHs 9.602 0.286 0.290 0. 400 
125 п-ОСНз 0.905 0.190 0.180 0. 623 
126 OCH 0. 597 0.316 0.316 0.529 
127 OC; His 1.018 0.190 0.190 0.716 
128 m-OCsHi7 1.112 0.190 0.190 0. 766 
129 MOCH CR BB) 0.875 0.217 0.442 0.475 
130 OCH,OH 0. 466 0.190 0.190 0.326 
131 OCH;CCH 0. 658 0.190 0.190 0. 293 
132 OCHzCaHs 9.820 9.303 0.311 0.311 
133 OC;H,0CHs 0. 684 0.135 0.190 0.190 9.47 
134 OCF; 0, 457 0.135 0.244 0.244 0.333 
135 OCh D. 544 0.135 0.324 0.324 0.398 
136 OCHCH; 0. 498 0.135 0.160 0.160 0. 865 
137 OCHCHCH; (E) 9.528 0.135 0.190 0.190 0.477 
138 OCHCHCH:(Z) 0.593 0.135 0.190 0.190 0. 365 
139 OCCH;CH; 0.487 0.135 0.190 0. 190 440 
140 OCOH 0.393 0.135 0.160 9.160 . 368 
141 OCOCH: 0. 487 0.135 0.190 0,190 0.368 
142 OCOCeHs о, 815 0.170 0.176 0. 184 0.440 
143 OCOOH 0,471 0.135 0.160 0.160 0.368 
144 OCONH: 0.482 9.135 0.160 0.160 0. 362 
145 OCONHCHs 0. 551 0.135 0.190 0.190 0.455 
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BR 

й v 取代 基 Liom Вэт Bainm Bynm Banm 
146 осм ~ 0.387 0.135 0.160 0.160 0. 401 
147 OCH; 0. 451 0.135 0.311 0.311 0. 589 
148 OSO;CH; 0, 403 9.135 0.190 0.357 0. 386 
149 050:С33 0. R20 0.161 0. 180 0.357 0. 364 
150 SH 0.347 0.770 0.170 0.170 0. 233 
151 SCH; 0.430 0.170 0.190 0.190 9. 326 
152 SCH; 0.524 0.170 0.180 0.190 . 397 
153 2 SCH, 0, 621 0.170 0.190 0.190 490 
154 ESCH: 0.495 o. 0.190 0.316 BE 
155 «-SC3Hs 0.504 0.224 0.229 0.414 
156 SCHo 0.715 0.190 0.190 0.56) 
157 FSC,H; 0.642 0.190 0.316 0.490 
158 80H. 0.621 0, 0,180 9.316 0. £90 
189 SC 0.524 9. 0. 286 0. 286 0. 423 
160 SC: Ha. 0.812 0.170 0.190 0.190 0. 654 
161 nSCeHis 0.905 6170 0.190 0.190 0.725 
162 -SCsHn 0.616 0.170 0.316 0.316 . 596 
163 n-SC;His 1.002 0.170 . 190 0.190 0. 818 
164 n-SC Hy; 1.096 0.170 0.190 0.190 0. 889 
165 人 SC 0.915 0.170 0.217 0.478 0.524 
166 SCH:;OH 0.506 0.170 9.190 0.190 0. 326 
167 SCH;CCH 0.689 0.170 0.190 0.190 0.361 
168 SCH;C,H; 0. 850 0.170 0.311 0.311 0.386 
169 SCF; 0.489 0.170 0.244 0.244 0.369 
170 SCHCH; 0.533 0. 170 0.170 0,170 0.423 
in SCHCHCH,(E) 0.540 0.170 0.190 0.190 0. 526 
172 SCHCHCH3(2) 0, 629 0.170 0.190 0.190 0. 423 
173 SCCH;CH> 0. 519 0.170 9.190 0.190 0. 476 
174 SCOH 0.425 9.170 0.170 0.170 0.401 
175 SCOCH, 0.519 0.170 0.190 0.190 0.401 
176 SCONH2 0.512 9.170 0.184 0.184 0.401 
177 SCONHCHs 0. 615 0.170 0.190 0.190 0.488 
178 SCN 0.408 0.170 0.170 0.170 0.445 
179 SCH; 0.457 9.170 0.311 0,311 0.642 
180 *S(CH3)2 0. 362 9.170 0.259 0. 286 0. 286 
181 SOCH; 0,403 9.160 0.249 0.293 9.336 
182 SO,CH; 0.437 0.211 0.267 0.267 0.315 
183 50:С:95 0.531 0.211 0. 267 0. 267 0. 367 
184 SO.F 0.350 0. 203 0.245 9.251 0, 270 
185 SO,CFs 0.411 0.211 0.267 0.267 0. 364 
186 SO2CsHs 0. 586 0.211 0.267 0.287 0.601 
187 SONH: 0. 382 9.211 9.267 0.267 0.307 
188 SO2N(CH3)2 0. 508 9.211 9. 280 9. 280 0. 360 
189 soy 0. 350 0.211 0,267 0.267 0.270 
190 SFs 0. 485 0.248 0. 249 0. 249 0.249 
191 NH; 0. 293 0.150 0,150 0.184 0.184 
192 NHCN; 0.353 0.150 0. 190 0.190 0. 308 
193 NHC;H; 0.496 0.150 0.190 0.190 0.342 
194 n-NHC3Hy 0. 607 0.150 0. 190 0.190 0. 436 
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# 

a 号 X 代 基 L inm Byam Bi/nm Buyinm 
195 +NHC;H; 0.496 0.190 0.316 0.415 
196 —NHC;H; 0.472 0.224 0. 229 0.364 
197 m-NHC,H; 0.701 0.190 0.190 0. 487 
198 CNHOHS 0. 607 0.190 0. 316 9.136 
199 МНС, 0.607 0.190 0.316 0. 138 
200 t-NHC.Hs 0.496 0. 286 0. 286 6, 398 
201 2-NHC; Has 0.813 0.190 0.190 0. 518 
202 C NHC;Hs 0.606 9.286 0. 290 0.407 
203 mNHCeHi 0.907 0.190 0.190 0.633 
204 eNHCHu 0. 600 0.316 0.316 0. 536 
205 n NHCHHs 1.018 5.180 0.190 0.726 
206 mNHGsHhs 1.112 0.190 0.190 0.778 
207 МНС Нь 0. 880 9.217 0.450 0.175 
208 NHCH;DH 0, 470 9.190 0.190 0.332 
209 NHCH,CCH j 0.582 0. 190 0.190 0.299 
210 NHCH:CsHs | 0.824 0. 309 9.311 9.311 
zu NHCHCH; | 0.502 0.150 0. 160 0.184 0.371 
212 NHCHCHCH;CE) 0. 531 0.150 0.190 0.190 0.482 
213 NHCHCHCH; (Z) 0.597 0.150 0.190 0.190 0.371 
214 NHCCH;CH; 0. 491 0.150 0.190 0.190 0.444 
215 NHCOH 0. 422 0.150 0.180 0.194 0. 361 
216 NHCOCH; 0. 515 0.180 0.190 0.194 0.361 
217 NHCOOH 9-501 0.150 0. 150 0.194 0. 361 
218 NHCONH; 0. 509 0. 184 0. 184 0,194 0.361 
219 NHCONHCH; 0.585 0.184 0. 194 0. 280 0. 361 
220 NHCOOC;H; 0. 445 0.150 0.190 0.497 0, 557 
221 NHCOCeHs 0. 840 0.191 0.311 9.311 0.361 
222 NHCSNH; 0. 462 0.150 0.234 0.287 9.418 
223 NHCN Í 0.390 0.180 0.180 0.184 0.405 
224 NHC,Hs 0.453 9.130 9.311 0.311 595 
225 NHNH; 0.340 0.186 9.184 0.184 0, 282 
226 NHSO,CH; 0. 406 9.156 0.190 0.359 0.388 
227 N(CHa)2 0.353 9.150 0.256 0. 280 0,280 
228 N(CFD2 0.401 0.150 0.310 0. 328 0. 338 
229 МСН). | 0.577 0.150 0. 464 0.534 586 
230 миў 0. 293 0.150 0. 184 0.184 0.197 
231 NCH), 0. 402 0.256 0.280 0.280 0.290 
232 NCCI; 0. 565 0.170 0.180 0.184 0. 454 
233 NCS 0.429 0.150 0.164 0.176 0. 424 
234 NCHCsHs 0. 840 0.170 0.180 0. 355 0. 366 
235 NNC,H; 0.843 0.170 0.170 0.192 0.431 
236 NCHN(CH;); 9. 577 0.160 0.190 0. 280 0.417 
237 NO 0.344 0.170 0. 170 0.170 0. 244 
238 NO; 0.344 0.170 0.170 0.244 0. 244 
239 Na 0.462 0.150 0.234 0.287 0.418 
240 了 (CHs): | 0. зв8 0. 200 0. 284 0. 297 0, 329 
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Re 

au RR ok Tinm Bonm Bum Bajnam Barum 
241 POGCAH); 7 CO] ово 0. 268 0. 468 0.548 0. 618 
242 10; 0. 428 0.215 9.246 0.338 0. 336 
243 2- BE Е 0.597 0.165 0.177 0.318 0. 216 


四 、 取 代 基 电 子 效 应 常数 与 立体 参数 的 协同 效应 


以 上 讨论 一 般 都 是 将 电子 效应 和 立体 效应 单独 进行 号 号 的 。 然 而 ， 在 实际 上 有 些 反应 却 

间 时 存在 着 两 种 效应 。 所 以 更 一 般 的 情况 似 应 由 下 式 给 出 ， 
lg K/K?) = po +8. (9-4) 

实际 上 , 式 (9-4) 就 隐 含 着 活性 自由 能 是 相 世 独立 的 电子 效应 和 立体 效应 的 综合 结果 , 用 
数学 语言 来 说 ， 活 性 自由 能 是 电子 效应 和 立体 效应 的 线性 组 合 。 这样 约 表达 式 对 平衡 常数 也 
同样 适合 。 式 (9-4) 构成 了 一 个 多 元 线性 回归 在 物理 有 机 化 学 应 用 的 一 个 最 早 的 例子 ， 它 首 
ЖШ Pavelich 和 Taft2749 引 人 定量 构 效 关系 研究 。 他 们 在 对 20°C 甲 柄 中 酸 碱 催化 (一 )- 甲 基 
栈 RCO:CrweH's 的 甲醇 化 的 研究 中 发 现 ， 对 子 酸 催 化 反应 ， 可 得 o= 0. 626，3 一 1. 549， 复 相关 
系数 R=0.992; 而 对 于 碱 催化 反应 ， 可 得 0—2. 702, 0—1.301, 99669 = 0. 996., ВЕ 
后 Biechler 和 Taft 又 将 此 关系 应 用 到 复杂 的 М-Н ЖЕДЕ. PhNMeCOR 的 碱 水 解 反 应 动力 学 
研究 之 中 5 。 另 一 个 应 用 是 由 Bowden. Chapman 和 Shorter 设计 的 ,他 们 发 现 , 具有 大 基 团 
(如 PhCH, PhO) FERK lgK, EARS oR E 没有 线性 关系 ，, 然而， 如 采用 由 式 
09-4) 所 示 的 多 元 线性 关系 式 来 进行 回归 ， 则 得 到 很 满意 的 结果 ,他们 对 在 25°C 下 ，50%2- 
六- 丁 氧 基 -乙醇 水 溶液 中 的 13 个 酸 的 研究 结果 可 由 下 面 的 方程 给 出 

lgK,=—6. 045+2. 6660-+0. 252E. 

所 得 的 复 相关 系数 尺 近 似 为 1" 。 类 似 这 样 的 例子 还 不 少 ， 读 者 可 参阅 文献 [1]。 


第 二 节 ”化 合 物 结构 的 数量 表征 方法 


化 合 物 的 结构 多 用 图 来 表示 ,通常 这 样 的 图 称 为 结构 图 或 分 子 图 ,不 同 的 化 合 物 其 结构 图 
也 不 同 ,于 是 ,如 能 将 不 同 的 化 学 结构 图 数量 化 ,并 通过 它 将 结构 与 活性 或 性 能 联系 起 来 ,这 就 
是 将 在 这 一 节 将 要 介绍 的 分 子 拓扑 指数 方法 。 最 早 引 和 人 此 方法 是 Wiene, KERETE 1874 
年 数学 家 Sylvester 就 指出 ,一 个 化 学 图 可 用 矩阵 表示 ,这 个 矩阵 叫 拓扑 矩阵 或 邻接 矩阵 ,如 化 
BD 253- Ah (1) 和 1,1,2- 三 甲 基 环 丙烷 CIO, 它们 的 结构 图 与 隐 氢 图 示 于 图 9-1, 


CH: сн CH; 
| N 
CH CH c 
N Z РА ^ >< 
CH, CH CH; CH 一 CH 1 AL 
i 
CH; CH; 


[225] 49; (I) (D 


图 9-1 (6552.3 PERE (1) 和 1,1,2- 三 
там O 的 结构 图 与 隐 氧 图 


可 分 别 用 邻接 矩阵 4, 和 А, 表示， 此 矩阵 中 的 元 素 a4 为 
„10 原子 ?和 ?没有 键 合 时 
"ou 原子 ! 和 ,有 键 合 时 
对 子 (1) 和 (1) 这 两 个 化 合 物 的 邻接 矩阵 分 别 为 
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0100000 
фо 0 1 0 0 0] 
1010010 А : 
jo 0 10 0 о. 
901201001 ! i 
[110110 
Ai 20010100 = 
0 0 1 0 1 Q 
0001000 | 
001101 
01000200 : 
(000010 
90010000 


RUSH 2,3- RE TUUS CIO 为 例 来 加 以 具体 说 明 。 从 图 9-1 可 以 看 出 ， 它 的 (1.2), 
(2,3). (2,6), (3.7), (3,4), (4.5) 结 点 之 间 有 边 ， 故 矩阵 的 对 应 行 与 对 应 列 的 元 素 是 1 。 
这 种 数字 表示 法 可 以 把 化 合 物 的 分 子 经 适当 变换 存 人 计算 机 中 .可 以 看 出 上 述 矩 阵 是 以 主 对 
角 线 为 轴 的 对 称 矩阵 ， 和 矩阵 中 的 每 一 行 或 每 一 列 的 元 素 之 和 即 为 分 子 图 中 相应 编号 的 那个 碳 
原子 的 点 价 。 这 样 ， 化 学 结构 就 可 用 折 扑 矩阵 中 的 具体 数字 来 描述 。 分 子 医 中 的 点 价 为 

A = Da, 
式 中 , ”点 数 即 矩阵 的 阶 。 就 是 在 这 拓扑 邻接 矩阵 的 基础 上 , 化 学 家 们 提出 了 很 多 种 分 子 拓扑 
指数 , 据 Trinajstic 等 子 1986 年 在 数学 化 学 杂志 上 的 评述 的 ,在 当时 就 至 少 有 39 种 不 同 的 拓 
扑 指数 ,而 根据 巴 纳 班 (Balaban) 在 一 篇 评论 中 指出 "5 , 大 约 存在 一 百 多 种 分 子 拓扑 指数 . 在 
本 节 只 将 对 应 用 最 多 的 和 新 近 发 展 的 几 种 作出 介绍 。 


一 、Wiener 拓扑 指数 


最 早 将 拓扑 指数 引信 化 学 的 是 Wiener-21.。 他 定义 : 分 子 中 所 有 不 同 碳 原 子 之 间 的 距离 总 
和 即 为 Wiener 拓扑 指数 ， 即 


W Wiener 指数 )= {34.,)/2 (9-5) 
后 来 ， 此 定义 被 拓 广 至 分 子 中 所 有 不 同 非 毛 原子 之 间 的 叶 离 总 和 。 
现 仍 以 化 合 物 2,3- 二 甲 基 戊 烧 为 例 来 加 以 具体 说 明 。 可 以 像 定义 邻接 矩阵 那样 来 定义 一 
个 距离 矩阵 ， 对 于 2,3- 二 甲 基 戊 烷 ， 其 距离 矩阵 D. 为 
0123 4 2 3) 
1012812 
2101221 
D,—|3 2 101 3 2 
4 3 2 1 0 4 3| 
2123403 
32 12 3 3 ol 


ЕЖЕ) LR RRP. HEEL, Wiener 指数 实际 就 是 对 上 述 距 离 矩 阵 的 上 三 
角 部 分 或 下 三 角 部 分 的 所 有 元 素 求 和 。Wienet 指数 在 一 定 的 程度 上 反映 分 子 的 特性 ， 所 以 它 
首先 就 被 用 来 研究 饱和 脂肪 烃 的 沸点 的 变化 规律 (参见 表 9-10), 


二 、Randic 分 支 指数 和 分 子 连接 性 指数 


(一 )Randic 分 支 指数 
具有 分 子 式 为 CeHis 的 五 个 已 烷 异 构 体 的 结构 式 、 隐 和 氢 图 及 其 对 应 的 拓扑 矩阵 都 不 相同 。 
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它们 在 结构 式 中 的 主要 不 同 完全 是 由 它们 的 分 支 程 度 不 同 而 定 ， 希 望 能 找到 一 个 “ 数 ”， 把 它 
们 之 阿 在 分 支 程度 不 同 的 区 别 表示 出 来 。Randice 指数 正 是 这 样 一 种 简便 的 “分 支 指数 ”, 它 可 
由 下 图 (图 9-2) 形象 地 表示 出 来 ; 


000001 ; 一 
000001 


2 


1 
cH Жул 000901 hy Vx 2 Li 
, Е 
000010 2 i i 


¿“N Z 1 1 
CH, сн; 000101 VA X 14 XI 


111010 


000001 1 1 


000001 “хта SAS 
` £ 90010 gg A ^ VX 3 
CH-CH же »—— UM 
4 ` > 
1 


1 4 1000010) ү 1 
001101 


110010 3х1 3x1 


000001) 


1 
o00001| A 
Nop CH: CHs As 4 3 900010 JA x2 
Z й 1 (0000 /— 
ch; Ha 
i 1001100 Á. 1 м х1 
x1 


(110100 


(0000011 i 


000010 LIP ^N 
CH. CH; 5 4 22 а А 
3X 
l 


Z `. ` NA 000100 
св, CH сњ 2 3 O ИТЕ 7 = i 
Ї 1 001001 1 xz і 


010001 


100110 ws 
8x1 


000001 i 1 
006010 vh x y у мх 
CH, CH CH: 6 4 2 221 
¿NANA AA (ооо AA 1 d 1 
cm сњ cu 155 mao ! ° ? ED 4х1 хт 
010100 
101000 


E 9-2 Randic 分 支 指数 示意 图 


Randic 分 支 指数 的 定义 可 由 下 式 给 出 : 
"—23X0/mnY/n) 

上 式 中 的 求 和 将 包括 所 有 的 边 〔 即 键 >, 其 中 > Al n 分 别 表示 该 边 〈 共 价 键 ) 所 连 的 两 个 碳 原 
子 的 点 价 ， 以 符号 'c RH. 

xc 可 以 定量 反映 开 链 饱和 烃 的 多 种 物理 性 质 ， 但 是 尚 存在 下 列 几 个 问题 

O 含 双 键 或 三 键 等 化 合 物 不 能 符合 这 个 指数 给 定 的 规律 ; 

@ 环 状 化 合 物 不 能 处 理 ， 因 为 键 的 数目 比 开 链 多 ， 

@ 含 杂 原 子 的 化 合 物 不 能 包括 在 内 。 
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对 此 ， 量 子 化 学 家 Kier24 提 出 了 分 子 连接 性 法 ， 对 Randic 分 支 指数 加 以 扩展 。 
(=) 分 子 连接 性 指数 
1， 两 个 基本 假设 
Kier 提出 两 个 基本 假设 ; 第 一 ， 表 示 化 合 物 分 子 结构 和 它们 若干 性 质 间 的 定量 关系 所 需 
要 的 “结构 信息 ”包含 在 化 合 物 分 子 的 隐 氢 图 中 。 对 于 烷烃 , 每 个 碳 原子 的 点 价 д, 等 于 AA. 
其 中 4 是 指 碳 原子 的 价 电子 数 ,上 是 所 连 的 氢 原 子 数 。 杂 原子 的 价 分 子 连 接 性 指数 用 8 表示 ， 
3 =Z h, RP Z' 是 杂 原 子 的 价 电子 数 ， 例 如 乙醇 中 的 OH，56 就 是 6 一 1 二 5。 下 了 还 给 
出 了 几 个 实例 ， 其 余 参 见 表 9-5, 
CH,CH,OH d —6—1-5 
(CH,);N д} =5-0=5 
(CH;);N~ 6) =5-0+156 


RIS —HRAF f FRE d 
基 H 5, MM и à 


БЕ 


| 
—N— (ERY) 


—N==(fi шр) 
一 一 

! 
E 

1 


л = OR oe o 


њо" 
Ho 
一 0H 
—о— 
—о 
Ос E80. 
OCR BE AH di К 


Оос) 


(一 )20 


6. 690 
0.254 


0. 085 


BUT AF AB Dr С, RUP Е ГЕ] ó 值 ， 因此 根据 向 原子 的 摩尔 折射 
率 进行 修正 而 得 到 它们 的 经 验 点 价 A GE 9-5). 

第 二 个 假设 是 : 化 合 物 分 子 的 性 质 和 隐 氢 图 的 连接 性 指数 问 存在 某 种 函数 关系 ， 可 用 连 
E Ж Co 来 反映 性 质 (P)， 也 就 是 说 化 合 物 的 性 质 是 和 分 子 连接 性 有 关 的 。 可 用 下 式 
жш: 

Co = b + 275,(m) "y, 

Җир, b OD TRAE HM, RMR SHAR ICH. b 为 一 常数 ，"X 为 
分 子 连 接 性 指数 ，t 为 子 图 类 型 ，z 为 图 中 连接 的 边 数 。 

子 图 有 下 述 4 种 类 型 : 

CO BEES BB tp Rm, 它 由 子 图 点 价 〈 只 含 碳 原 子 ) 不 大 于 2 的 子 图 构成 ,如 
包括 条 原子 在 内 ， 则 每 个 点 至 多 和 两 条 边 丰 连 的 子 图 叫做 路 径 项 。 以 下 给 出 几 个 路 径 项 的 
BT. 


⁄ > A MA 
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D ЖЛ BAM =e RMR, 它 的 子 图 点 价 (只 含 碳 原 子 ) 至 少 为 3 或 4, 但 不 包括 点 价 
为 2 的 子 网 构成 ， 假 如 包含 杂 原 子 ， 则 每 个 中 心 点 须 和 З 条 边 或 4 条 边 相连 ， 这 样 的 子 图 叫 
ET, ATAR TIARE Т: 


ACA Ap Š 


(3) 路 径 / 簇 项 RERA im pc 表示 , 它 的 于 图 点 价 除 3 或 4 外 ,还 必须 有 2 的 点 价 
存在 , 同样 , 如 包含 有 林原 子 , 其 定义 按 杂 原子 的 路 么 项 、 条 项 综合 定义 ,具体 例子 如 下 所 示 : 


^v X "N^ k= 
CD $ fJ t= CH 表示 , 它 的 于 图 至 少 包 含有 AR, 下 图 给 出 了 几 个 其 体例 子 ， 
A р Z рту 
CX 6 SENSN 
有 了 上 述 两 个 假设 和 有 关 定 义 ， 就 可 求 得 分 子 连 接 性 指数 了 。 


2. 分子 连 接 性 指数 的 求法 
分 子 连接 性 指数 "X: 是 以 所 有 不 同类 型 的 相连 的 子 赂 求 和 而 得 ， 以 下 式 表 出 : 


"x= > "5, (9-6) 
AP n EDS m di КТА, S 是 子 图 项 , i; 是 子 图 序号 ， 分 子 拓扑 性 质 最 关键 的 关 
系 是 取决 于 点 价 。 
子 图 项 计算 公式 如 下 ， 
78,5103, È (9-7) 
KR (9-6) MR (9-7) 可 知 ， 欲 计算 一 个 分 子 的 分 子 连 接 性 指数 ， 必 须 剖 析出 所 有 的 子 图 ， 
Anse ба PA Hn 9-6 所 示 。 


表 96 异 成 烷 的 于 图 家 


Br m OO. 
FERE — 
1 2 3 4 
i А А 
À. ~ 
REN 
Ae 
. A 
ил Д, 
веет AY 


Ф®ввҗш» À. 


2， 分 子 连 接 性 指数 的 计算 举例 
CO 零 阶 项 "的 计算 ” 零 阶 项 的 子 图 是 由 一 个 点 构成 的 于 图 ， 其 边 数 PE. 计算 公式 
如 下 : 


s= Dar? 
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例如 正 友 烷 ， 它 的 隐 氧 图 为 22 , 
1 2 1 
ay =E= 
хия. EMBARAS п |, 
172 


LHI RHS YEH/ T 


则 y= DOS VTA EHEH THT 


Rem, Еви del 
1 1 


则 °= 58 t=1//l1+1/Z1+1/ +1/ ZT +1/ 1 


(2) 一 阶 项 :X 的 计算 “一 阶 项 的 子 图 是 由 两 个 点 构成 的 子 图 ， 
ШЕ: 
u-XNGSri 
仍 举 几 个 具体 的 例子 来 具体 说 明 。 
BRE. COBRA LA. 
1 


2 1 


2 z 2 2 
而 它 的 子 图 则 是 1 ， ` Io. ` 


BOL, 它 的 一 阶 连 接 性 指数 为 


其 边 数 为 1、 计算 公式 


Y= DOS) t=1/ /15X2-+-1/ EXOT /2X2+1/ 
I 


XE. ERE VOTE 
12 


1 3 3 1 
它 的 子 图 则 是 3:1, 52x 


它 的 一 阶 连接 性 指数 为 


1X2=2.414 


‘y= (88) =1/ /1X844/ V 1X84-1/ /35<3-+1/ 
1 


NMG, БЕА vo. 
1 1 


| А 人 
它 的 子 图 则 是 : 4 ， 1 ， Ty l 


它 的 一 阶 连 接 性 指数 为 


1X2=2. 270 


у= 588)? =1/ XA /1х4-Е1/ TX H-1/ 
(3) 二 阶 项 纹 的 计算 ”二 阶 项 的 子 图 是 由 三 个 点 构成 的 子 图 ， 
AT. 
= 39,073 


2 24 2 
` 


шеб, EM TIR Á ` 
所 以 ， 它 的 二 阶 连 接 性 指数 为 


2 1 


1Xi-2.000 


其 边 数 mm 为 2, 计算 公式 


= X (88073 —1/ VTXEXB--1/ /2<X2X2+1/ VEXORI= 1. 354 


1 1 
对 于 异 成 烷 ， 它 的 于 图 是 взу, {у Y. 
1 2 
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二 阶 连 接 人 性 指数 为 


= (88,8 1=1/ /1X3X1+1/ У VAX3XU4-1/ /3X2X1= 1.802 
1 


对 于 新 皮 烷 , 它 的 隐 氢 图 为 1” 


`, , 它 的 子 图 则 是 Дд... А oasi Hh 
l 1 1 1 1 1 
二 阶 连接 性 指数 为 
2y= 319,807 $ = 6X (1/7 Z1X4x1)=3.000 
(4) 三 阶 项 六 的 计算 三 阶 项 的 子 图 一 般 是 由 四 个 点 构成 的 子 图 ， 其 边 数 到 为 3， 计算 
AX. 


з= T0606) -+ 

三 阶 项 可 能 有 3 种 类 型 的 子 图 ， 即 路 径 项 、 簇 项 和 和 链 项 。 如 果 是 链 项 ， 则 三 阶 项 是 由 三 个 点 、 
三 条 边 所 组 成 。 

下 面 以 正成 烷 , 异 成 烷 和 新 成 烧 为 例 来 说 明 三 阶 项 的 计算 。 对 于 让 成 烷 , 它 只 有 路径 项 、 
子 图 是 和 及 RA 

22 2 1 
所 以 ， 它 的 三 阶 连 接 性 指数 为 
зу= (88,800 1 /1X2X2X2+1 /2X 3X 2X 1 —0. 707 

BITRE CHEM AA, —A MEN, ROT DA 


1 

32, [1 
Лү буу 
š š 


1 
故 其 三 阶 路 径 项 为 
зу, = Dd) F=1/ VIXSXZX14/ /1X3X2X1=0.816 
КЕ ЕЕ 
Y 2 


BE =O RRA 
з (8826) z—1/ VIRB XIX] =O. 408 
对 于 新 成 烷 ， 则 只 有 三 阶 艇 项 ， 面 无 三 阶 路 径 项 。 其 三 阶 簇 项 子 图 为 
1 1 1 
tar ala Ane ah 
1 1 


1 1 1 1 


故 其 三 阶 入 项 为 
з= 5(660,00 -l=4X Q/ VTXIXT XE) $2. 000 

(5) 四 阶 项 多 的 计算 : 四 阶 项 的 子 图 一 般 是 由 五 个 点 构成 的 子 图 ， 其 边 数 mA a, 计算 

公式 如 下 
= E (д8,д040-1 

四 阶 项 可 能 有 4 种 类 型 的 子 图 ， ШИЙ ДЕЛ, ЖИ, ЧЫЙ ИМЕ / ЖОЙ. ШЕ ЖШ. ШШ 
阶 项 是 由 4 个 点 、4 条 边 所 组 成 。 

对 于 正成 烷 ， 它 只 有 路 径 项 ， 其 于 图 即 为 隐 氢 图 


22 


408 


所 以 ， 它 的 四 阶 连 接 性 指数 为 
= 3,58) $—1/ /1х?Х2х?Х1—0.35% 
异 戊 烷 则 既 无 四 阶 路 径 项 '% LAS тутот 


WTEOARBAEE s, 
1 3 
它 的 四 阶 连接 性 指数 为 
t = T6600:60,) t= VIXIX3X2X1=0.408 


RG LOT EY, MATER BER o TA RT «OU, T 
GREASE du 
l H 


它 的 四 阶 连 接 性 指数 为 
= 21(58,,8,)  — 1 /1X1X1X1X4=0. 509 
Ж 9-7 列 出 了 庚 烷 各 种 异 构 休 的 各 关子 图 数 日 。 


表 9 7 庚 烷 异 构 体 路 径 、 簇 、 路 径 / 往 项 的 子 图 数目 胡 


* "u x x 总 
EAE m “% - -一 - - - - - 
P © Р c pç Р с ре р с pc p с р 
— 
[56 5 4 0 3 0 0 2 9 90 | 9 9 H о 9 
NN 
6 6 6 1 3 6 8 0 © 2 0 09 1 A 1 5 
V 
"Y 6 6 5 1 3 o 2 1 0 2 9 2 0 T 1 4 
! J6 € 4 1 3 0 Loe 0 1 0 2 123 1 3 
人 入 -~ 
A А : 
w. 6 了 6 2 2 ò 5 0 1 3 0 0 1 21 3 3 
J 人 $ 7 4 2 4 0 2 1 о 9 5 1 V g 7 
- 
x E 8 6 4 1 1D 8 5 09 4 9 0 1 d 5 H 
KA 6 8 4 4 3 10 3 0D 0 4 0 0 1 2 5 8 
> 6 9 6 5 0 1 9 0 3 2 0 1 © n Y H 


三 、 分 子 识别 数 


无 论 是 分 子 的 Wiener 指数 还 是 分 子 的 Randic 的 分 支 指数 都 存在 着 退化 性 或 称 简 并 性 ， 
即 不 同 的 分 子 具 有 相同 的 指数 值 , Zee 9-10 中 , 2,2. TRE ИО Wiener 指数 为 46, 而 2， 
3- 二 甲 基 成 烷 的 Wiener 值 数 也 为 46, 这 就 说 明 在 Wiener 指数 指标 中 存在 着 退化 性 , 像 这 样 的 
例子 还 可 举 出 不 少 ; Randic 的 分 支 指数 的 退化 性 没有 Wiener 指数 那么 严重 , 但 也 存在 着 同样 
的 退化 性 ，3- 甲 基 庚 烷 与 4- 甲 基 庚 烷 就 可 产生 同样 的 Капас 分 支 指数 。 所 以 ， 在 1984 年 ， 
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Randic 又 提出 了 了 分 子 识别 数 (MDN) à НОР, 分 子 识别 数 这 … 指 标 实际 上 
是 分 子 连接 性 指数 和 分 子路 径 数 的 一 种 结合 ， 或 更 精确 的 说 ， 是 一 种 加 权 的 分 子路 径 数 ， 其 
中 权 信 就 与 分 子 连接 性 相关 只 。 在 给 出 分 子 识别 数 的 定义 之 前 ， 先 看 厦 有 关 分 子 和 原子 的 路 
径 数 。 表 9-8 给 出 了 2- 甲 基 了 人 烷 的 全 部 有 关 路 径 数 。 有 关 该 表 的 具体 理解 可 参看 图 9-3. 结合 
表 9-8 和 图 9-3， 可 以 看 到 , 在 计算 路 径 数 时 ， 实 际 上 将 只 有 一 个 点 ， 即 路 径 等 于 零 时 ， 也 算 
存在 一 个 路 径 数 ， 另 外 ， 在 计算 路 径 大 于 零 时 的 路 径 数 时 ， 分 子 的 路 径 数 是 原子 路 径 数 的 二 
分 之 一 ， 这 是 因为 在 计算 原子 路 径 数 时 ， 同 一 路 径 算 了 两 次 《参见 图 9-3)。 在 介绍 了 路 径 数 
概念 基础 上 ， 分 子 识别 数 的 数学 定义 可 由 下 式 给 出 : 


А 
MIDN= Mus (9-8) 
; 7 


AP, w 是 路 径 权重 ; 下 标 0j 表示 对 子 所 有 长 度 为 零 的 路 径 , MFE ik 则 表示 所 有 长 度 大 于 
零 的 路 径 。 


Aes 2- 甲 基 丁 烷 的 原子 和 分 子路 径 数 一 览 表 


HEKER | 
原子 编号 а 总 和 
9 1 2 3 4 
1 1 m" 2 d | 0 5 
2 1 3 1 ° o 5 
3 1 z 2 ° | 0 Š 
4 1 1 1 H 0 5 
5 1 1 2 1 j 0 á 
ATWO 5 4 RENI | E 


分 子路 径 数 总 和 :15 


有 关 权 重 的 计算 由 下 述 原则 确定 : 

(D 长 度 为 零 的 路 径 的 权重 都 为 1; 

图 长 度 大 于 零 的 路 径 的 权重 由 其 分 子 连接 性 指数 确定 。 

表 9-9 给 出 了 2- 甲 基 了 烷 的 全 部 有 关 路 径 权重 ,。 从 表 9-9 中 可 以 看 出 , 2- 甲 基于 烷 的 分 子 
识别 数 为 &. 6968019, 


RA 2- 甲 基 丁 烷 的 原子 和 分 子路 径 权重 一 览 表 
KEKEN 


原 于 编号 T T 总 和 
0 1 2 3 4 

1 1 0.5774 0. 5690 0.1687 ° 2. 3131 

2 1 1.6629 0. 2887 a 0 2.8516 

3 1 1.1154 0.4714 9 o 2.5868 

4 1 о. 7071 0.2887 0. 3333 o 2,3291 

5 1 0.5774 ©. 5690 0.1667 о 2.3181 
A TER ЕШ 5 2.2101 1.0934 0. 3333 0 


分 子 识别 数 :8. 6968019 


表 9-10 列 出 了 部 分 CC, БИЙИ A. Wiener 指数 .Randic 分 支 指数 和 分 子 识别 数 ， 从 
3 9-10 RI DURER , BENRA Wiener 指数 、Randic 分 支 指数 和 分 子 识别 数 都 存在 较 好 的 线 
性 相关 性 , 其 中 沸点 与 Wiener 指数 的 相关 系数 为 0. 971; 沸点 与 Randic 分 支 指数 的 相关 系数 
3 0.994, 分 子 识别 数 与 沸点 的 相关 性 最 好 。 
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P 路 e KE 
WIES p TT — автана 
a 1 2 3 5 
1 一 2 一 3 
1 一 : 一 2 一 3 一 < 
1 1-2 1925 | 1 
2—1 
2 2 2-3 1 2—3—4 
2—5 
3 з 3-2 3 一 2 一 5 
3 一 4 3-2-1 
4 4 4—3 4 3 2 h 
4 
5 _. 5--2 1 
5 5 5—2 5 з 


9-3 与 表 9-8 HD RE RO RR ET EB 
39-10 82 C,—C, 烷烃 的 沸点 、Wiener HRM. Randic 分 支 指数 和 分 子 识别 数 


化 信物 Wa | Wiener 指数 Randi 4 83888 分 子 识别 数 
Ta —11.73 9 ym 6.7321 
ETH —0. 50 10 1.914 6.8713 
2,2-9 ЖР 9.50 16 2.000 8. 5000 
2-W GR T t 27.85 18 2.270 8.6968 
ERE 36. 07 20 2.414 8, 8499 

49.74 28 2.561 19.4660 
57.99 29 2.643 10.5236 
60, 27 32 2.770 10. 6792 
3- 甲 其 成 烷 63. 28 31 2.808 10. 6759 
EBS 68.74 35 2.914 10.8392 
22 — R ДЫЙ 79.20 46 3.061 12.4490 
2,4- 二 甲 基 皮 烷 80, 50 48 3.126 12.5092 
2.2,3- 三 80. 88 42 2.943 12.2931 
86.03 44 3.121 12.4427 
89. 78 46 3.181 12. 5052 
DELETE 90. 05 52 I 3.270 12.8704 
3- 甲 基 已 烷 91. 85 50 i 3. 308 12. 6600 
3- 乙 基 成 烷 93.48 : 48 3.6 12. 6692 
ER 98.42 — | 56 | 3.414 12.8338 


为 计算 分 子 识别 数 , Randic, Wilkins 等 提供 了 一 个 计算 该 值 的 Basic 程序 , 用 它 来 计算 一 
般 分 子 的 分 子 识别 数 将 比较 容易 "7"]。 

Randic 对 400 多 个 分 子 结构 ,其 中 包括 10 个 碳 原 子 以 下 的 所 有 烷烃 进行 了 分 子 识别 数 的 
计算 , 没有 发 现 退化 性 。1985 4£ , Trinajstic 等 对 包括 20 个 碳 原 子 以 下 的 618 000 种 烷烃 结构 
进行 了 系统 地 计算 ， 发 现 其 中 有 124 种 化 合 物 的 两 个 异 构 体 和 1 种 化 合 物 的 3 个 异 构 体 分 别 
具有 相同 的 分 子 识别 数 , 如 2,3- 二 甲 基 -6- 乙 基 -5- 异 丙 基 辛 烯 与 2,6- 二 甲 基 -5- 乙 基 -3- 异 两 基 
辛 烯 就 是 其 中 的 一 个 例子 (中, 它们 具有 完全 相同 的 分 子 识别 数 . Randic 后 又 对 分 子 识别 数 进 
行 了 改进 ， 提 出 了 第 二 分 子 识别 数 ， 读 者 可 参阅 文献 [29]。 
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B. RREA FH 


1989 4E, ЖЖ (Schultz) 又 提出 了 了 称 为 分 子 岳 扑 指数 (MTD RR. 8—11} 
指数 的 优点 是 它 的 退化 性 不 严重 , 很 多 上 述 方法 中 具有 相同 特征 数 的 分 子 对 ,它们 的 Schultz 
分 子 柄 扑 指数 是 不 相同 的 。 为 方便 起 见 , 现 仍 以 2- 甲 基 丁 烷 为 例 来 说 明 Schultz 分 子 拓扑 指数 
构成 方法 。2- 甲 基 丁 烧 的 隐 氢 图 示 于 图 9-3, 它 的 距离 矩阵 (р). PRERE СА) 和 各 原子 的 
ARRE (v) 如下: 


01232 0 1 0 0 о] 
то 10101 
D= 2 10 12 A= 01010 
32103 0 0 1 0 о! 
21230 lo 1 » 0 ol 


»-[1 3 2 1 1] 
Muller SF 9 8 НОО, xt AE EEAE REPAS (5 dE ESHA TB AMAR у. 在 此 ， 
Schultz 是 用 的 也 矩阵 和 4 矩阵 的 和 ， 即 (D+A) 


131 232 (01000 
noted boron 
DtA= 2 1 0 0125901010 
32103 [0 0 1 0 0| 
2 230) loroo o 
022 3 2) 
20222 
=/2 20 22 
3 2 203 
22 2 3 0 


继续 对 CDA) 与 ”的 乘积 所 得 矢量 的 所 有 元 素 求 和 就 得 到 了 Schultz 分 子 拓扑 指数 ， 
vD+A)=[15 10 12 16 15] 


MTI-154-100-124-16--15— 68 (9-9) 

Schultz Xf 42 种 不 同 的 烷 烽 进行 了 分 子 丘 扑 指数 的 计算 ， 所 得 结果 示 于 表 9-11。 在 表 9- 
11 中 的 第 17 号 和 第 18 号 , 第 19 号 和 第 20 号 、 第 24 号 和 第 25 号、 第 27 号 和 第 28 号 、 第 
29 号 和 第 315. 第 31 号 和 第 32 号 、 第 21 号 和 33 ©, 第 41 号 和 第 42 号 这 些 分 子 对 都 是 别 
的 分 子 描述 指数 相同 而 难 区 分 的 分 子 对 。 虽然 ,Schultz 提出 的 分 子 拓扑 指数 在 分 子 结 构 描 述 
的 退化 性 有 所 进步 , 但是， 对 于 此 分 子 拓扑 指数 与 沸点 的 相关 人 性 却 不 如 Randi 分 支 指数 。 为 
此 ,Schultz 提出 使 用 CD 十 4) 和 矩阵 的 行列 式 值 和 第 一 特征 值 等 数量 指标 ”来 描述 分 子 特性 ， 
以 改善 它们 与 分 子 化 学 性 质 的 相关 性 。 在 此 将 作 进 一 步 介 绍 。 

仍 以 2- 甲 基 丁 烷 为 例 来 进行 说 明 。 对 于 2- 甲 基 丁 烧 的 距离 矩阵 D Яй (D+ A) 矩阵 ,它们 
的 行列 式 分 别 为 32 和 176; 它 们 的 特征 值 分 别 为 :和 .=7. 45929; 4, — —3. 86269; A= — 2. 0000; 
A, —1. 08462; а= —0. 51198 (DER); A 一 8. 85345; а= — 3. 38547; A= —2. 0000; A= 
一 2. 0000; ¿s= —1. 46798 (D+ A EPF). 在 此 没有 提 到 拓扑 邻接 算 阵 A, 这 是 因为 Trinajstic 已 
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对 此 进行 过 研究 ， 他 所 得 结果 说 明 折 扑 连 接 年 阵 A 的 特征 值 是 一 个 退化 性 很 高 的 指标 ， 很 多 
不 同化 合 物 的 拓扑 邻接 矩阵 的 特征 值 相同 5 。 
表 9-11 部 分 Ci 一 Cu 烷烃 的 沸点 和 分 子 拓扑 指数 


ag 化 合 b жа ATH | 编号 化 会 % aa PIB 
BLZ E o | 22 [2.2.3 HRT R 156 
2 |Z 一 88.6 | a [o ram | 306 
ША 42 18 24 З-Д 276 
4 | ETH 1 38 25 | 1-H MEO 272 
5 |2- 甲 基 丙 演 36 26 |2,5- i ĦED t 270 
6 | ER 74 27 |2,2- 二 甲 基 已 烷 260 
т |29 жт 27.85] 68 28 |2,4. PR ul te 258 
8 |2,2-— 3k be 9.50) 64 29 PRC 246 
9 | Rake 68.74] 128 30 ED BE 244 
10 |2-B Ж 60.27| 118 31 2 тй 242 
п із тад | 63-28) 114 32 | 3- 乙 基 -3- 甲 基 成 烷 232 
12 £57.99] 108 | 33 [2.23.4- MIR RTH і P 
13 - 49.74] 108 34 E | 438 
14 98.42) 204 | 35 | he 604 
15 | 90.05] 190 36 |+—й | 808 
16 91.85| 182 3 | Fok 1054 
17 80.50| 176 38 | bake 1346 
18 93.48] 174 зэ um 1688 
19 | 2,2- 二 甲 基 成 烷 79.20| 170 | 40 | 十 五 烧 2084 
20 | 2.3-— GRGUER вте ges |a SORES CREE ARS 1366 
21 |3,3-=Ф ЖУ 86.03] 162 a2 | RIF M-6-Z, 5A RA, 1358 
Ж 9-12 列 出 了 对 前 述 42 种 不 河 的 烷烃 的 距离 矩阵 D RI. (D+ AD ME EIS A19 ME TTA 
应 的 第 一 特征 值 及 用 它们 分 别 计算 所 得 的 沸点 值 , 为 列表 方便 在 此 略 去 了 这 些 化 合 物 的 名 称 ， 
只 保留 了 它们 的 编导 。 由 (D+ AD 矩阵 的 行列 式 绝对 值 的 lg 值 的 平方 根 对 相应 沸点 值 进行 回 
归 计 算 的 相关 系数 为 0.994; TAER ER р 5—2 le 值 对 相应 沸点 值 进行 回归 计 
算 的 相关 系数 为 0.969; 由 (D+ AD 矩阵 的 第 一 特征 值 之 lg 值 对 相应 沸点 值 进 行 回归 计算 的 


相关 系数 为 0. 987, 说 明 采 用 这 些 数值 来 计算 可 提高 Schultz 分 子 拓扑 指数 与 相应 化 学 性 质 的 
相关 性 。 


表 9 12 ВЯ ССВ z ЖИЕ ЕРЕ D PED 1 4| 特 征 值 之 间 的 关系 


由 |D+A4| 计 算 RA (D+ А) 
编号 沸点 ID| ID+A| 
MAA D| |D+A| RAR кїй 
1 一 161 0 0 0 0 
2 — 88. 6 =l 一 4 — 108.8 1 2 一 119. 3 
3 —42 4 6 一 47.4 2.7321 4 一 48.6 
4 — 0.50 -12 ~60 一 2.3 5.1623 6. 53113 l4 
5 —11.73 一 12 —48 一 9.4 4.6458 6 一 7.3 
6 36.07 32 224 35.8 8. 2882 9. 72970 42.0 
7 27.85 32 176 29.2 7.4583 8. 85345 32.4 
8 9.50 32 E 20.2 6. 6056 8 22.1 
9 68.74 一 80 一 817 68.9 12.109 13. 6116 76.3 
10 60.27 —80 —656 83.5 11.059 12.5154 67.7 
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BR 

as 沸点 "n pig | BIDTABER NE jan 
| RI ә D| 1D+4| | 算 的 沸点 信 
" 一 80 | 83.1 10.712 12.1719 64.9 
12 — 80 i 57.3 ID 11. 4031 58.2 
13 — | 54.8 11.0769 55.3 
14 98.42 192 | 97.9 18.1783 105. 8 
15 90.05 192 93.8 $ 16.0208 98.5 
16 93.5 192 93.8 | 15.7492 91.2 
17 92 192 93.8 | 19.3497 95.0 
18 j 80.6 192 88.4 | 15.8472 90.5 
19 79. 20 192 85.6 i 15.0970 86.9 
20 89.78 192 88.4 15.0731 86.7 
21 86.03 192 86.0 14.4942 82.7 
22 80. 88 192 80.8 13.8023 77.7 
23 25.7 一 448 --9486 123.8 23.4318 131.7 
n 19 E —8127 120.6 21. 3026 122.0 
25 17.7 —ив —8160 uec | 21.0738 120.9 
26 09.1 一 448 一 6864 изо | 19.112 20. 6428 118.8 
27 06.9 448 6220 i 115.9 18.413 19.9327 115.2 
28 99.5 —48 | — 686 116.9 18-296 19. 8985 115 
29 17.7 -448 | -6700 116.5 17. 678 19.147 1l 
30 12 MEETS —6124 114.6 17.443 18.9193 | 109.9 
5 17 | Ade 一 6832 116.9 17.419 18.8774 109.6 
32 | 18.3 — 448 --6076 114.5 16. 671 18.1096 105.4 
33 06.3 —448 一 3520 102.6 16.3459 95.0 
34 1 ов 1024 31007 147.7 29.3729 154.7 
35 174.1 —2304 —100095 170.0 34.343 36.0037 178.5 
36 8 5120 320048 1911 41.638 43. 3249 196.4 
37 2 一 11264 —1014208 211.1 19. 629 513375 | 21.7 
38 | 4 24576 3188230 230.0 38.314 60.0420 ， 227.7 
39 | — 53248 — 9954933 248.2 67. 694 69, 4390 | 242.5 
40 2 114688 30910288 265.6 77.769 79. 5288 256.3 
41 114688 17734496 257.1 31.924 53. 5129 215.9 
42 114687 16622076 256.1 52.136 L. 53. 7266 216.3 
最 近 ，Klavzar 和 Gutman 对 Schultz 分 子 拓扑 指数 与 Wiener 指数 的 关系 进行 了 研究 5， 
他 们 证 明了 Schultz 的 分 子 拓扑 指数 与 Wiener 指数 存在 如 下 关系 : 
aW<MTISAW 
具体 地 说 ， 可 由 以 下 两 个 表达 式 具 体 给 出 : 
D 如 果 G 为 一 连接 图 ， 则 


Zu W (G)<<MTI(G)=<2o,,,W (G) 
式 中 ,om 和 wsx 分 别 表示 最 小 和 最 大 的 点 价 数 。 
O 如 果 分 子 结构 隐 氢 图 G 为 一 多 环 芳烃 体系 , 则 有 
4W(G)<MTI(G) iW (G) 
sh = 6+6/( M15 X25) —6. 9295, 
O@ 两 个 关系 表明 ，Schultz 分 子 拓扑 指数 与 Wiener 指数 之 间 存 在 一 定 的 线性 相关 关 
R. EXE, 对 于 烷烃 来 说 , 在 Schultz 分 子 拓扑 指数 与 Wiener 指数 之 间 存 在 一 定 的 线性 相关 
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RACBAALT ARAM OHO, 

巴 纳 班 曾 在 一 篇 评论 文章 中 指出 ， 用 实数 来 表达 顶点 不 变数 的 确 应 可 看 成 是 第 三 代 的 分 
子 拓扑 指数 。 据 他 的 评论 称 2 ,第 一 代 分子 拓 扑 指 数 是 以 对 局 部 顶点 不 变数 LOVT) Bf] 
单 操作 而 得 的 整数 ;第 二 代 分 子 折 仆 指数 是 对 由 那些 对 局 部 医 点 不 变数 的 整数 进一步 进行 复 
厅 操 作 而 得 到 的 实数 ， 第 三 代 分 子 拓扑 指数 则 应 是 那些 从 第 二 代 分 子 拓 朴 指数 进一步 操作 而 
得 到 的 实数 。 关 于 此 三 类 分 子 拓扑 指数 的 具体 方法 及 其 特性 已 到 于 表 9-13 之 中 。 


表 9-13 基于 局 部 顶点 不 变数 IOVIS) 的 第 三 代 分 子 拓扑 指数 


分 于 药 扑 指数 代 LOVI Bor AT MIME А 过 化 性 或 简 并 性 
aR BK [ETT [T3 Г 
第 一 代 BERANA 结构 性 计算 实数 中 等 或 低 
第 三 代 实数 REXSUH 实数 [3 


按照 巴 纳 班 的 分 类 方法 , 像 Wiener 指数 就 应 为 第 一 代 分 子 拓扑 指数 , 第 一 代 分 子 拓 瞧 指 
数 的 例子 还 有 : 
(D Zagreb 的 基 团 拓扑 指数 ， 记 为 MUS 


M = 22: (9-10) 
@ Gordon-Scantiebury 指数 ， 记 为 Non | 
N= MG 1/2 (9-11) 
O 平方 指数 , 记 为 O | 
Q = [ >) (ë — we + 21/2 (9-12) 


在 (9-10) 一 (9-12) 三 式 中 ,@ 均 表 示 为 分 子 图 的 点 价 。 实 际 上 ,(9-10) 一 (9-12) 三 式 存 在 着 以 下 
的 线性 关系 : 
Q=N-—n+2=3—2n-+(M/2) 
M=2(N+n—1) 
式 中 ,为 分 于 隐 和 氨 图 中 的 巴 点 数 。 
一 般 说 来 ,第 一 代 分 子 拓扑 指数 都 共有 较 高 的 退化 性 。 
第 二 代 分 子 拓扑 指数 的 典型 代表 是 Randic 的 分 支 指数 和 后 由 Kier 拓 广 的 分 子 连接 性 指 
数 ,另外 一 个 例子 是 分 于 图 的 所 有 顶点 的 均 方 距离 指标 , 记 为 Ds, 
D? = (N/a — D] (9-18) 
ELEME LU IH BS MEE P РАНТА. 
第 三 代 分 子 拓扑 指数 可 以 是 这 样 一 些 指标 ， 它 们 的 局 部 顶点 不 变数 是 由 实数 表示 的 ， 这 
样 的 例子 可 以 是 邻接 矩阵 或 距离 矩阵 的 特征 值 、 行列 式 值 等 。 在 此 仅 介绍 一 种 由 Balaban 等 提 
出 的 这 样 的 第 三 代 分 子 拓扑 指数 2 ， 他 们 称 之 为 回归 焉 离 和 及 回归 顶点 点 价 。 


五 、 回 归 距 离 和 回归 顶点 点 价 


因 顶 点 点 价 反 映 了 该 顶点 与 其 相连 顶点 的 关系 ; 而 顶点 之 间 的 距离 和 则 反映 了 一 些 更 远 
虐 离 顶 点 对 该 顶点 的 影响 ， 所 以 ,分 子 拓扑 图 中 的 顶点 点 价 和 顶点 之 同 的 距离 和 已 在 第 一 代 
和 第 二 代 的 分 子 拓扑 指数 中 得 到 了 相当 广泛 地 应 用 。 巴 纳 班 等 在 这 里 则 通过 同 妇 顶点 点 价 来 
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增强 项 点 点 价 的 作用 ， 使 它 能 将 一 些 喝 远 的 项 点 的 贡献 也 被 包括 进来 ， 当 然 ， 随 着 距离 的 增 
大 ， 其 作用 也 将 相应 减少 ; 而 回归 距离 和 则 是 起 到 相应 的 增强 简单 顶点 和 的 作用 ， 而且， 经 
此 增强 后 ， 这 些 指标 都 成 了 实数 ， 这 样 就 可 以 达到 减少 拓扑 指标 退化 性 的 目的 。 下 面 将 通过 
两 个 简单 的 例子 来 加 以 说 明 。 

图 9-4 和 图 9-5 分 别 给 出 了 几 个 具体 构成 回归 项 点 点 价 和 回归 距离 和 指标 的 例子 。 


1 E 
WAS 2 4 LA 
2 3 ` X 
i 3$ à AA 
5 4 1 3 4 5 
2 i n 1 
顶点 点 价 、 £ 2 1j3 1 
° И 个 个 \ AY 4 
1 2 1 Y 
2 2 ? 1 1 
m: 1 2 3/1 2 3 4 à3|1 2 3 4/1 2 3 
1 2 5 4 l 2 2 2 1 1 3 3 1 1 4 3 
z 3 7 2 2 3 2 1 0 | 3 1 1 0 4 4 0 
RE E 3 7 2|2 4 2 0 0|2 a 2 0|1 4 8 
4 z 5 5/2 3 2 1 Of 2 2 3 2/1 4 3 
5 2 5 5|1 2 2 2 111 3 3 1/1 4 3 
2.8981 1. 5017 А | 
RVD} 2.4647 2.4647 ren Len 
3. 9491 ¢ I М 3.5370 | 1.3924 4.30 
| ; 
ШИ 1.3633 2.5741 1.3633 
2.8102 1.5017 2 87H 1.6111 1.611 
2.64 1.331 a 
RVD)" 3.72 2.321 2.321 | #8 143 
‚72 С ^ . . 
— 3.411 vm < 
2.55 12221 2.42 1.2221 /A ad 1.43 
> 1.331 2.42 ' 


图 9-4 回归 顶点 点 价 计算 示意 图 


从 图 9-4 和 图 9-5 可 以 看 出 ,为 四 张 具 有 五 个 碳 原子 的 隐 氢 图 进行 了 编号, 并 将 这 些 
碳 原子 的 点 价 或 各 顶点 到 该 点 的 距离 和 标 出 。 然 后 ， 构 成 了 一 个 矩阵 ， 在 该 矩阵 的 第 一 
列 中 ， 简 单 地 计 下 该 顶点 相应 的 点 价 和 距离 ， 而 在 该 矩阵 的 第 二 列 中 ， 则 将 与 其 最 邻近 
的 顶点 所 标 出 指点 价 或 距离 进行 加 合 ， 即 将 只 与 该 顶点 直接 相连 GREE 1 的 ) 的 顶 
点 的 相应 数 加 合 ， 对 于 该 矩阵 的 第 : 列 ， 则 将 与 该 顶点 以 〈#; 一 1》 tHE ER S+ 
@—1) 的) 的 顶点 的 相应 数 加 合 。 两 个 顶点 之 间 的 最 大 更 离 称 为 该 分 子 图 的 直径 ， 它 也 
等 于 该 矩阵 的 列 数 。 
得 到 这 两 个 矩阵 后 ， 相 应 的 RVD, 和 RDS, 则 可 通过 以 下 两 式 来 进行 计算 ， 
ТОУ? = Yr y, (9-14) 
LOVI2=2>10y, (9-15) 
在 此 , y, SCR HEE A 11Ж MTOM. 由 (9-14) (9-15) 式 计 算出 来 的 局 部 顶点 不 
变数 在 图 9-4 和 图 9-5 的 最 后 两 行 给 出 . 这样 所 得 到 的 分 子 拓扑 指数 将 具有 很 小 的 退化 性 .用 
这 些 指标 计算 了 35 个 烷烃 (一 5 一 8) 的 沸点 , 所 得 的 相关 系数 为 0. 985, 可 见 它们 也 具有 很 


416 


好 的 化 学 特性 表达 功能 。 
1 1 3 
顶点 编号 А а р _ 
ü ? 3 Мм, 
OONAN У 
5L ta 1 3 $ i 3 5 
" f 7 А 7 7 
ERA 7 Js 5 Ke 
s/s A 5 9 - 
' £... J o 
10 8 19 8 š 2 
sg 6 7 7 
7 Т Т T 
fl 2 зра 2 š за — è 
1 | __ | 
1 $ ы [ют s 7 wile 5 M 95/5 4 al 
2 5 вт 16 7 I 0,5 2 s 0,4 2 9 
矩阵 3 5 
4 6 N n 1 7 жю of 8 s 5 wile 4 Z 
5 6 n njm 7 6 7 p8 > H 9,7 4 2 
7.6944 9.2741 y "m 
RD? A 8.4165 9.4138 Same TTS 
7.3472 8.083] 10.1852 7.5 
/ з - 185 1.5 
» 12.0066 8. 4907 12. 0066 PA zu “вот 
7.7824 e sane 8.2778 82778 
7.12 Ж . . 
RDS}? A 868 8.68 & ôt EI ds 
6.76 ^ 7.29 ^ 9.666 . 
— LU dE 
. 10.768 7.5 10.768 N " 
7M 8.649 7.36 8.16 8.16 


图 9-3 ”回归 距离 和 计算 示意 图 


第 三 节 构 效 关系 建 模 方 法 


一 、 基 于 回归 分 析 的 建 模 方法 


由 前 述 方法 得 到 了 分 子 结构 的 数量 描述 指标 后 ， 一 个 最 直接 的 方法 就 是 用 回归 方程 将 这 
些 分 子 结构 的 数量 描述 指标 与 化 合 物 的 某 种 性 质 联系 起 来 ， 并 用 最 小 二 乘 的 方法 得 到 相应 的 
回归 参数 (а, а, +, а), BB 

y=az dexter. (9-16) 

可 以 说 目前 很 多 构 效 定量 关系 的 研究 都 基于 此 。 下 面 将 摘要 地 介绍 这 方面 的 一 些 具体 

应 用 。 

O 分子 连接 性 指数 与 立体 参数 间 的 关系 ”由 Тай 提出 的 取代 基 立 体 效应 参数 E 值 是 

一 个 经 验 值 . 不 少 基 团 的 Е, 值 用 类 比 法 还 难以 得 到 , 所 以 使 用 受到 严重 限制 。 对 已 知 EE 值 的 
18 个 脂肪 酷 类 烃基 部 分 ， 用 分 子 连 楼 性 指数 可 与 E, 值 建立 如 下 相关 关系 方程 式 "”， 

五 一 一 0. 54422—1. 40? x-- 1. 09* y 0. 403 

其 复 相关 系数 R0 961。 从 逻辑 上 来 看 ， 反应 中 心 OIME 周围 的 基 团 由 子 立 体 效 应 而 影 

响 反 应 速度 ,因此 用 ?2X、?X 等 延伸 项 可 反映 这 种 课 集 现象 ， 即 反映 与 反应 中 心 相连 的 基 团 的 多 


少 及 其 立体 效应 的 大 小 。 
(D 分 子 连 接 性 指数 与 胸腺 喀 啶 磷酸 酯 酶 抑制 剂 活性 关系 ”11 个 N, 位 烃基 和 芳烃 基 取 
ЖЕЛЕ ЕН ЕШ CBE 9-14) 的 活性 与 的 QSAR SERW: 


i| |=0366'y—3.364 
其 复 相关 系数 为 0. 920 RP e 为 物质 的 浓度 (mol L’), 
ТОТ" 


в 
R ` x 

i 观测 值 计算 值 

I ma | 3.698 R3» -2.01 

Ts 5.235 | 一 上 35 — 144 

FRE 5.592 | —1.30 1.31 

HRE 8.270 —1.28 —1.43 

Rc 6.092 一 1.17 一 1.13 

友基 5.736 一 1.15 —1.26 

3- 莱 再 基 7.254 一 1.11 —0.71 

2-ж 5 6.754 —0.80 —0. 89 

AERE 8.254 | —0. 76 1.07 

LETE 7.754 | —0.60 ! —0.52 

5.8 8,254 — 0.32 | —0 34 
G) AF ERR 2- OR tu REME ER 2- RMR (^ VOS p po 
BRAM. HR BOD TERE RA le E 21 个 化 合 物 建立 的 QSAR 方程 式 ， 


获得 显著 效果 。 
]g 1=0 2455 159—6. 3933 *Xscr — 13. 1189 “сут +3. 4448 


AP, poros PPB u 2 uk FE RR RRE: "Xevr 为 含有 嘱 
TAS RT HS Oe 6 原子 回路 项 。 应 用 分 子 连 接 性 指数 计算 所 得 结果 见 
Ж 9-15, 

MÆ 9-15 可 以 看 出 , ФЕНА PREME SERERE ARAI. 因 母 核 结构 
不 同 , ЖЖ. 这 从 QSAR WRAY HT DARE WEE HUE ВИЛИН er RARE RE 
表示 它 使 母体 活性 降低 ，- - 般 要 降低 0. 64 对 数 单位 值 〈 化 合 物 9 一 15) 和 1.01 对 数 单位 值 
(化 合 物 1$ 与 17) 。 

含有 六 元 哌 啶 环 与 吗 啉 环 的 也 使 活性 降低 ， 方 程式 中 *xevr 项 的 系数 亦 为 负数 ， 提 
示 这 两 种 六 元 环 基 团 对 活性 呈 负 变 影响 。 一般 要 降低 1. 03 对 数 单位 值 〈 化 合 物 18 与 
19) 和 0. 59 对 数 单位 值 化合物 20)。 这 可 能 是 六 元 环 立 体 障 碍 较 大 而 妨碍 分 子 与 党 
HRA. 
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表 9-15 4) TER ERM 5 ЕИ нн 


QSAR 方程 式 的 计算 结果 
[1 A 
ACHo—N N- £ S 
у — 
9 R 
T i 
编号 An an| R z uer | "Rn | | er ав li 
实验 计算 
TM. . . 
1 | н z Br 8. 0864 2. 0000 о. оров 5.63 15. 43 D. 20 
2 JA 2 C) | aeg | 0.0000 1 0.0000 | 5.47 5.33 Ol 
aff} 2 H | 7.1788 | 9.0000 | ooon | 5.01 5-20 0.19 
| 
CHCH, 
4 JN— 2 Br 7.9993 ; 0.0000 0.0000 5.42 5.41 6.01 
CH;CH; 
1 
CHCH? 
5 六 一 z сі т.6081 | 0.0000 | 0.0000 5.33 5.31 0.02 
CHiCH; И 
CH;CH; 
$ SN 一 2 с 7.0845 | 0.0000 | 0.0000 , 8.37 5.19 0.18 
CH; 
CHsCHa | 
7 N— 2| H 6.5208 , 0.0000 ' 0.0000 5.09 0.05 0.04 
CHy | 
CHCH: 
8 2N— 2 Pr | 7.4222 | 6.0000 | 0.0000 | 5.13 5.27 0.14 
CH; 
| 
9 z cl 6.4671 0.1000 | 0.0000 5.03 4.39 0.64 
10 z Br 6.8584 | 0.1000 | 0.0000 4.89 4.49 0.40 
ll 2 | SCH, | 7.3993 | 0.1000 | 0.0000 | 4.67 4.82 0.05 
i 
12 JN— 2 | OCH; | 6.4683 | 0.1000 | 0.0000 , 4.84 4.38 0.25 
CH; 
CH; 
13 ж— 2 | CH, | 6.3560 | 0.1000 , 0.0000 | 4.44 4.37 9.07 
CH; 
сн 
14 >N— 2 | OH | 6.0769 | 0.1000 | 0.0000 | 4.05 4.30 0.28 
CH; i 
CH; 
15 >N- 2 H 5.9430 | 0.1000 | 0.0000 | 3.84 4.26 0.42 
CH: L 


续 表 
ШЕ 
! ` | c ud 
编号 An a R X Е Steve | ° ) laig — 
| xe | 计算 | 
CH; | | 
16 »N— з ! Br | т.3502 | 0.1581 | 6.0000 | 4.12 4.23 0.11 
CH: 
сн, 
17 ум з а 6.960] | 0.1581 | 0.000 1.80 4.14 0.34 
CH; 
UN | | | i 
B| N= 2 CL | 81955 | 0.0000 0.07905 | 4.88 442 0.46 
__/ H 
⁄ ` 
19 |4 N— 2 H 7.6791 | 0.0000 | 0.07905 | 4.23 4.29 0.06 
v Z 
yoy 
20 о N— z © 7. 7728 0. 000 0. 0456 2.07 4.75 0.68 
N Z 
C. O. 
і 
21 UM а 8.1706 | 0.0000 | 0.0000 5.20 5.45 0. 25 
| 
CHCH-CH)N(CH2)1 


DFAT RAIA, А ЖЫ БОЕ ETS ER cO UIS ES 000 mol L. 


4) 分 子 连接 性 指数 与 化 合 物 其 他 的 理化 性 质 的 关系 研究 ”化合 物 分 子 的 理化 性 质 不 仅 
取决 于 分 子 和 原子 的 数目 〈 加 合 性 )， 而 且 还 取决 于 原子 在 分 子 中 的 排列 〈 构 成 性 )。 而 分 子 
连接 性 指数 可 以 把 分 子 的 加 合 性 和 构成 性 的 结构 信息 都 译 制 出 来 , Kier, Hall, Murray 等 深入 
研究 了 分 子 连 接 性 指数 ， 认 为 其 和 分 子 若干 的 物理 性 质 有 显著 相关 性 。 例 如 ， 原 于 离 解 热 和 
生成 热 、 摩 尔 折射 率 、 分 子 极 化 度 、 气 体 方程 经 验 常数 、 气 化 热 、 沸 点 、 液 体 的 密度 、 有 机 
液体 的 水 溶性 、 分 配 系数 等 10 余 种 物理 性 质 观察 值 和 用 分 子 连 接 性 指数 与 之 建立 的 方程 式 而 
计算 出 来 的 数值 几乎 完全 一 致 ， 读 者 可 参阅 文献 9 。 

分 子 连接 性 法 是 1975 年 才 提出 来 的 ， 虽 在 不 断 发 展 中 克服 了 不 少 问题 , 例如, 初步 解决 
了 杂 原 子 的 点 价 等 问题 ， 但 还 有 很 多 不 足 之 处 。 例 如 指数 的 种 类 太 多 ， 物 理 意义 不 明确 ; TH 
数值 对 几何 异 构 体 无 法 区 别 ， 所 以 顺 反 式 的 * 值 是 等 同 的 ; 对 化 合 物 的 构象 也 无 法 区 别 。 另 
外 , Яй. 确 等 元 素 在 共 价 键 中 的 9 值 尚未 规定 出 来 。 所 以 这 些 还 有 待 子 进一步 发 展 ,改进 和 


完善 。 


二 、 基 于 模式 识别 的 建 模 方 法 


将 模式 识别 技术 用 于 定量 构 效 关系 的 研究 是 近年 来 取得 的 新 进展 。 有 关 化 学 模式 识别 的 
一 些 方法 在 第 七 章 已 经 介绍 ,在 此 只 对 它们 在 定量 构 效 关系 中 的 应 用 研究 情况 给 出 简要 讨论 。 

化 学 学 科 的 一 个 中 心 任务 就 是 要 研究 化 合 物 的 结构 与 反应 活性 的 关系 ， 尤 其 是 一 些 有 关 
生化 芭 应 中 的 结构 与 活性 的 关系 近年 来 受到 化 学 家 的 广泛 关注 ,正如 本 书 前 节 讨 论 的 那样 ,这 
些 关系 影响 因素 较 多 ， 如 极 性 性 质 、 立 体 效应 等 ,用 量子 化 学 进行 详细 的 理论 计算 则 太 复杂 
而 且 计 算 量 太 大 以 致 难 子 实施 。 这 样 ， 化 学 模式 识别 就 成 了 现在 少数 几 个 有 用 的 研究 定量 构 
效 关系 手段 之 一 ,值得 引起 化 学 家 的 重视 *。 
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化 合 物 的 结构 可 由 一 个 “主干 ”(backbone) 和 一 些 主 上 上 特殊 位 置 的 取代 基 来 描述 ,这 
样 一 些 特殊 位 置 上 的 取代 基 的 化 学 性 质 就 可 用 在 上 节 讨 论 的 - 些 参 数 来 进行 描述 ， 一 此 特殊 
的 性 质 还 可 通过 基 子 力学 的 计算 得 到 ， 这 样 ，-- 组 具有 相同 化 学 结构 主干 的 化 合 物 就 转变 成 
为 一 组 数据 矢量 来 表示 ， 不 同 的 反应 特性 就 应 该 具有 不 同 的 数据 结构 。 一 些 已 知 反应 特性 的 
矢量 数据 可 构成 化 学 模式 识别 方法 中 的 训练 集 (参见 第 七 章 )、 通过 训练 ， 就 可 对 一 些 具 有 同 
样 化 学 结构 主干 的 未 知 化 合 物 的 反应 特性 来 进行 预测 了 。 

在 这 里 讨论 一 个 例子 ， 有 这 样 一 系列 具有 如 下 化 学 结构 主干 的 化 合 物 ; 

X(Y)—C,H, СНОК)-- CH(R )--NH—R° 

在 这 里 ，5 种 不 同 取代 基 X、Y、R、R' RR? 可 从 HH 变化 到 CH (CH) CHCH,- OH. 采用 
前 述 方法 将 这 些 化 合 物 由 一 组 数据 矢量 来 表示 ， 其 小 只 有 一 个 变量 是 由 量 测 给 出 。 这 组 数据 
的 训练 集 由 32 个 化 合 物 所 构成 ， 每 个 化 合 物 由 13 个 变量 表 出 。 训 练 集 由 两 类 不 同类 型 的 化 
合 物 组 成 ， -类 的 反应 活性 高 , AKER. 共 15 个 ; 另 一 类 的 反应 活性 低 , 为 阻 洪 剂 ， 共 17 
f. Dunn 等 采用 SIMCA 方法 对 这 些 数据 进行 了 分 析 ， 得 到 了 一 此 有 用 的 结果 ， 并 对 未 知 物 
也 作 了 预测 、 涪 明 化 学 模式 识别 是 一 种 有 用 的 进行 定量 构 效 关系 研究 的 方法 ”1。 类 似 的 例子 
可 参阅 文献 C47，48]。 

锅 材 断裂 性 能 的 模式 识别 分 析 。 增 典 钢铁 公司 试制 了 15 个 新 钢 种 , 在 新 钢 种 的 钢材 加 工 
过 程 中 ， 有 9 种 钢材 开裂 ， 另 6 种 不 开裂 ， 为 了 查 明 钢 中 微量 元 素 对 钢材 开裂 的 影响 ， 他 们 
分 析 了 这 15 种 钢材 中 的 17 种 微量 元 素 ， 并 用 模式 识别 的 SIMCA 算法 寻找 规律 . 结果 发 现 ， 
“好 钢 ” 的 成 分 代表 点 集中 在 一 个 较 小 的 区 域 , 可 包括 在 一 个 高 维 空间 的 包 络 面 内 ;“ 坏 钢 ” 的 
数据 点 则 很 分 散 。 这 是 因为 : 引起 开裂 的 原因 不 止 一 种 ， 故 “ 坏 钢 ”区 事实 上 是 多 个 区 域 的 
Jem. “МИ” ADEE AR Se BC ALA IA, Wold 称 这 类 情况 为 “不 对 称 SIMCA ЯТ”), 

模式 识别 用 子 药物 设计 。 据 1978 年 估计 ， 全 世界 用 于 找寻 新 药 的 费用 每 年 达 20 亿美 元 
左右 , 每 发 明 一 种 重要 的 新 药 耗资 为 4000 万 美元 。 为 了 更 快 更 省 地 开发 新 药物 , 追 切 需要 总 
结 化 合 物 分 子 结构 和 疗效 的 关系 ， 以 提高 探 素 的 命中 率 。 这 种 构 效 关系 研究 可 有 演绎 法 和 归 
纳 法 两 种 。 演 绎 法 是 从 量子 生物 学 角度 查 明 药物 活性 的 机 理 从 而 确定 何 种 结构 最 有 效 。 但 目 
前 的 知识 水 平 距 这 一 目标 尚 十 分 届 远 。 归 纳 法 则 是 利用 模式 识 草 等 方法 从 大 量 实验 结果 中 总 
结 规律 。 这 一 方法 虽然 是 纯 经 验 性 质 或 半 经 验 性 质 ， 但 切实 可 行 。 由 干 新 药 研制 中 合成 和 药 
理工 作 量 很 大 ， 费 用 也 相当 高 ， 即 使 是 模式 识别 方法 的 预测 率 的 准确 度 不 高 ， 也 能 产生 一 定 
效益 。 用 模式 识别 搞 药物 设计 的 最 大 困难 ， 是 如 何 选取 有 效 的 结构 描述 参数 ， 一 种 常用 的 方 
法 是 假定 生物 活性 与 结构 套数 有 线性 关系 ， 这 当然 是 一 种 粗略 的 近似 或 简化 。 

Kowalski 和 Bender 用 模式 识别 方法 研究 抗 癌 药 的 构 效 关系 1. 他们 取 200 个 化 合 物 (其 
中 87 АЛИШ МО. ЖЕТ 20 个 结构 参数 ， 其 中 下 列 参 数 最 为 有 效 : 

CD 硫 原子 数 /总 原子 数 ; 

© C—S 键 数 / 碳 原 子 数 ; 

@ S—H 键 数 ， 

@ C—C 键 数 / 碳 原 子 数 ; 

O 碳 原 子 数 /总 原子 数 。 

用 线性 判别 函数 法 和 天 最 邻近 法 ， 分 类 率 可 达 90%% 左 右 。 但 也 有 人 对 这 种 分 类 判别 方法 提出 
不 同意 见 。 
Chu 等 用 线性 判别 函数 法 和 最 邻近 法 用 51 个 变量 来 识别 188 个 药物 的 抗 癌 活 性 5 。 


预报 24 PRA SURI TE. RORE (83~92)%. 
BUR УЕ ИНА ЕВН АА ТОНЯ. SMI (РАН) 致癌 是 有 关 环 保 和 癌症 病因 的 重要 
课题 。 人 们 通过 大 量 实验 注意 到 : SHH ART UE BEA BARR. Bl 3. 4E 


DO 
He СОУ 是 强 致癌 物质 ， 而 同样 有 5 个 荣 下 的 Janan. BA 


Pullman 提出 的 K-L 区 理论 以 解释 多 环 芳烃 分 子 的 结构 与 致癌 活性 关 以 来 ， 这 一 课题 … 直 
тян жере —. К.ж RP жатака 882 EET SAR 
TORR. ЖЖЖ, ERIR, TAS RRA HER. ИИЙ 
BARU BS ATH. КАЯ НЛ ЖЕРИ Г Ж ОРЕ BON EER 
жп, 

BOE CAL M HOME RAR BERE. Schiffman НИ stn SL WAR BN (t fr 9 6 Ho X: 
系 。 由 25 个 结构 化 学 参数 (包括 Raman 光谱 信息 ) 组 成 的 模式 空间 。 用 非 线性 映照 的 方法 对 
30 个 化 合 物 分 类 ro 。 

Jurs 用 线 性 判罚 函数 法 详细 研究 了 麻 香 化 合 物 的 构 效 关系 。 训 练 集 包括 60 个 磨 香 化 合 物 
和 240 MEM GO. MIAD ce 68 MARREN СЫЛ FR. ЭЕ ILA 
述 单元 )， 从 中 筛选 出 13 个 最 有 效 的 参数 。 计 算 结果 表 明 : BA OWNER REE BÀ 
个 分 子 参数 ， 而 是 由 多 个 分 子 参数 次 定 的 。 用 9 个 未 列 人 训练 集 的 化 合 物 的 分 类 来 检查 模型 
的 预报 能 力 ， 分 类 效果 很 好 F9。 

McGill 等 用 模式 识别 方法 筛选 影响 化 合 物 香 哑 的 主要 结构 因素 ,从 红外 光谱 ,紫外 光谱 
核 酷 波谱、 分 子 量 、 熔 点、 沸点 、 密 度 、 族 光 性 、 水 溶性 、 醇 性 和 化 学 键 参数 中 选择 特征 量 ， 
结果 从 43 个 变量 中 找到 两 个 主要 影响 因素 一 -分子 的 电子 施主 特性 和 偶 极 矩 :1， 

微量 元 素 与 病因 学 的 模式 识别 研究 .近年 来 人 们 注意 
到 ,微量 元 素 的 比例 失调 是 许多 病 (尤其 是 地 方 病 ) 的 病 
内 或 重要 尖 素 ,定量 元 素 三 的 防 阅 作 用 近年 来 受到 广泛 注 
意 ， 同 时 也 发 现 其 他 几 种 元 素 对 硒 有 捕 抗 作用 。 为 了 查 明 
多 种 微量 元 素 对 痪 症 发 病 率 的 影响 ， 陈 念 皮 等 5* 取 25 个 
国家 和 两 个 地 区 的 居民 (通过 食物 ) WM, RN NS 
惠 的 平均 报信 量 为 模式 识别 的 特征 变量 构成 模式 空间 .将 
这 些 国家 和 地 区 的 (根据 年 龄 修正 的 ) RCRA, 。 

中 ， 作 非 线性 映照 ， 结果 如 图 9-6 所 示 ， 原 始 数 据 列 于 表 

9-16。 从 图 9-6 可 以 看 出 ,乳癌 高 发 病 国家 《乳癌 访 亡 率 

大 子 每 10 万 人 中 17 A 和 乳癌 你 发 病 国 家 分 布 在 不 同 区 图 9-6 MRTRRARS 
Ho 其间 有 明显 的 分 界线 , 这 一 研究 结果 提出 了 一 个 发 于 
深 省 的 问题 , EL ER A. HARREN пово тек 
家 转化 为 低 发 疗 国 家 ? 

模式 识别 与 催化 研究 。 催 化 问题 是 化 工 生产 晤 重要 的 问题 之 一 。90% 以 上 的 化 工 生产 都 
要 有 催化剂。 催化剂 的 研制 往往 是 一 个 化 工 流程 成 败 的 关键 催化 现象 很 复杂 ， 广 泛 应 用 的 
多 相 俊 化 光 其 如 此 ,从 分 子 水 平 看 , 催化剂 表面 的 原子 排列 和 电子 结构 是 催化 作用 的 基础 ,由 
子 催化 剂 成 分 很 复杂 ， 多 为 复 相 ， 表 面 结 移 和 成 分 噬 未 能 完全 查 明 ， 更 无 法 用 “原子 级 加 
工 ”来 榨 制 表面 结构 ， 活 性 中 心 往往 由 局 部 表 而 结构 决定 ， 曾 局 部 表 而 结构 的 量 测 至 今 肖 天 
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液体 流动 问题 ， 这 又 和 催化 剂 的 显 微 结构 有 关 。 催 化 剂 的 制备 方法 、 制 备 条 件 和 显 微 结构 有 
着 复杂 的 联系 ……， 所 有 这 一 切 都 决定 着 催化 剂 研究 的 复杂 性 。 近 年 来 ， 由 于 计算 量子 化 学 
的 长 足 发 展 ， 为 我 们 提供 了 有 关 催 化 的 大 量 信息 ， 为 从 更 深入 的 理论 上 解决 催化 问题 投下 了 
一 线 曙光 ， 但 真正 用 量子 化 学 和 表面 分 析 技 术 彻底 弄 清 和 掌握 催化 问题 还 很 遂 远 。 在 这 种 条 
件 下 ,模式 识别 法 倒 可 作出 一 些 有 益 贡 献 。 


表 9-16 元 素 扰 入 星 与 乳癌 死亡 率 的 关系 


HAR’ Gra) Т 3 
ka 5с Cu zn са Cr Mn As crim o 
澳大利亚 | 759 1125 68 — 123.9 ma 0 шл 3 
奥地利 71.6 824 4272 77.0 22.0 858 102.4 3: 17 
比利时 70.6 141 4425 80.5 211 803 158.2 21 
mek 61.8 874 5313 97.2 21.9 711 139.1 23.5 
5x FLL 725 4387 76.9 18.6 677 166.0 24 
前 西 德 64.3 784 4473 74.4 20.6 781 136.3 17.5 
爱尔兰 79.1 836 3712 99.7 16.4 889 1444 Í 21.5 
以 色 列 77.3 822 4443 77.1 Zhi 923 136.9 n 
mox 87.8 693 3741 70.8 20.3 101 108.5 , 26 
Wok 82.2 608 4128 87.5 17.0 СА 269.1 155 
ж Ж 65. 8 703 3783 74.8 18.3 646 167.1 18.5 
я + 65.6 850 4169 83.6 23.2 819 109.6 21.5 
х 国 61.7 729 4502 85.4 T 717 132.2 25 
美国 61.0 849 5108 87.3 25.4 652 132.8 21.5 
保加利亚 197.6 861 3924 79.5 16.7 1129 102.1 9.0 
в W 85.1 838 4712 82.6 15.3 1029 120.2 15.5 
go 67.1 690 3623 88.2 13.7 716 139.1 13 
法 国 76.4 881 5339 91.5 21.2 965 173.8 16 
в om 91.9 911 4452 92.3 17.7 1154 185.4 8.5 
香港 《中 国 》 91.2 639 2959 54.6 19.6 463 273.4 10 
KFA 86.5 768 3958 72.4 118 1075 91.3 14.5 
意大利 82.5 855 4304 83-8 16.4 1161 134.4 16.5 
H 本 85.8 643 2420 43.4 17.4 674 233.4 3.5 
# = 93.8 634 5231 80.3 15.9 876 138.3 11 
Bat 87.2 714 4347 74.6 15.8 1008 268.5 12.5 
台湾 СРЕ) 84.1 592 1674 33.3 12.8 522 184.3 4.0 
前 南斯拉夫 98.6 722 3288 72.9 11.7 1169 821 | 8.0 
二 维 模 式 识别 在 催化 研究 中 的 应 用 。 甩 两 个 变量 作 二 维 参数 图 有 时 也 能 总 结 一 些 催化 规 
律 。 下 面 以 乙 烧 与 氧化 氢气 相 加 成 反应 为 全 加 以 说 明 。 乙 做 与 氮 化 氢气 相 加 成 反应 是 基本 有 
机 合成 的 重要 反应 之 一 , 用 和 氮 化 物 所 含 金 属 的 电荷 -半径 比 和 电 负 性 为 坐标 作 图 , 20 余 种 氢化 
物 的 催化 活性 在 图 上 旦 规律 性 分 布 《 图 oT), 


从 图 9-7 可 以 看 出 ， Hg", 


低 ， 它 们 之 间 有 明显 分 界线 ， 界 面 方程 为 

2/3243. 45-=0 
AP, c/n 表示 电荷 /半径 ，x 表示 电 负 性 。 

此 式 可 与 刘 祈 涛 提出 的 金属 离子 软 硬 酸度 判 据 相对 照 


Pd**, Си", Ag' SUILUTIS HEAL TE ERC. 其 他 阳 高 子 活性 较 


f=—=/r--32 +2. 2 

由 此 可 知 ， /大 于 或 小 于 一 1. 25 是 研究 的 催化 活性 高 低 的 分 类 判 据 。 这 说 明正 是 离子 的 软 硬 
琴 碱 特性 和 这 一 反应 对 应 关系 。 

金属 氧化 物 上 的 一 氧化 磋 氧 化 反应 是 另 一 个 例子 。 内 爹 属 氧 化 物 的 生成 热 AH, MERR 
化 物 阳离子 的 半径 7 为 坐标 作 图 . 一 氧化 碳 氧 化 活性 分 布 寨 类 较 好 《图 9-8)。 活 性 低 的 C 区 
Ж. ВеО. GeO,. ALO, SOs 活性 高 的 A KAT. Мо0,, CoO, MnO, СаО, Ag,O. МО, 
CuO, SnO,. CuO 和 ZnO, 活性 最 高 的 氧化 物 , 集中 在 + 约 为 65pm， 一 AH' 在 209 ~ 
376. 2kJ * mol 范围 。 这 暗示 有 几何 因子 和 能 量 因 子 起 作用 . 催化 作用 很 复杂 , 用 两 个 因素 概 
括 常常 是 不 够 的 ， 因 此 需要 多 维 空间 模式 识别 。 
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图 9-7 乙 鼎 与 氧化 氨 的 加 成 反应 中 维 化 剂 的 活性 ов ”一氧化碳 氢化 反应 催化 剂 活性 


三 、 基 于 人 工 神 经 网 络 的 建 模 方法 


如 在 第 六 章 和 第 七 章 所 述 ， 人 工 神经 网 络 技术 既 可 用 于 多 元 校正 〈 回 归 ) 又 可 用 于 模式 
识别 ,特别 是 它 的 非 线性 映照 的 特性 , 更 使 得 它 在 构 效 关系 QSAR) 研究 中 独 具 魅 力 - 故 近 
年 来 在 化 学 构 效 关系 的 建 模 中 得 到 了 十 分 广泛 的 应 用 ， 是 目前 化 学 计量 学 研究 中 的 一 个 热点 
Gur, 

人 工 神经 网 络 在 构 殖 关系 (QSAR) 研究 中 有 很 好 的 应 用 前 景 。 一 些 研究 过 的 例子 如 1- 申 
2-4 ARE 1,2,3,6- 四 氧 吡 啶 (MPTP) 的 同类 物 对 人 肝脏 二 氢 蝶 啶 还 原 酶 〈DHPR) 的 抑制 
HERA QSAR), Н IRIE (NPAH) 的 致 突变 活 狂 与 分 子 结构 参数 之 间 的 关系 'o0、 
对 位 取代 荣 酚 入 生物 的 生物 活性 与 其 结构 及 物理 化 学 性 质 参 数 之 间 的 关系 “I、 气 络 合 物 中 
Eul 1) 离子 的 46-4 及 5d-4£ 二 类 光谱 皮 迁 与 其 结构 参量 之 间 的 关系 "中 ,等 等 。 这些 课题 均 
用 人 工 神经 网 络 方法 取得 了 很 好 的 结果 。 用 人 工 神经 网 络 处 理 传感器 阵列 数据 ， 可 进行 化 学 
物质 及 其 气味 的 辨识 -中 。 许 多 国家 对 投放 市 场 的 种 子 是 否 杂 有 外 来 异种 有 严格 规定 。 
Chtioui 等 "比较 了 不 同 的 人 工 神经 网 络 方法 用 于 种 子 的 分 类 鉴别 。Cinarm" 探讨 了 时 间 序 列 
模型 及 人 工 神经 网 络 用 于 动态 化 学 过 程 模拟 。 基 于 径 基 范 数 的 ANN 模型 被 认为 更 适 子 描述 
动态 化 学 过 程 。 

总 之 ， 人 工 神经 网 络 在 构 效 关系 研究 中 方兴未艾 ，H 望 解决 一 些 在 经 典 回归 方法 和 模式 
识别 方法 难于 解决 的 一 些 回 题 ， 是 一 个 值得 继续 研究 的 领域 。 
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第 十 章 ”人工 智能 与 化 学 专家 系统 


人 工 短 能 与 化 学 专家 系统 是 一 个 综合 性 很 强 的 科技 领域 ， 可 以 说 是 本 书 中 前 述 方法 的 一 
个 逻辑 性 的 集合 。 本 书 将 其 列 为 一 章 ， 其 主要 初衷 是 想 对 其 在 化 学 计量 学 研究 中 的 地 位 给 子 
必要 的 强调 ， 另 一 方面 ， 还 因为 人 工 智能 与 化 学 专家 系统 一 般 都 需 大 量 引 用 化 学 不 同 领域 知 
识 ， 需 要 建立 数据 库 ， 又 有 其 特殊 性 的 一 面 ， 故 将 其 分 列 成 一 章 。 本章 将 主要 介绍 一 些 常用 
的 人 工 智能 与 化 学 专家 系统 的 基本 要 素 ， 在 此 基础 上 还 将 介绍 一 些 如 何 构建 化 学 专家 系统 的 
基本 思路 和 框架 。 而 对 于 和 如何 具体 构造 数据 库 等 细节 知识 将 不 在 本 书 进行 详细 讨论 ,所 以 ,本 
章 将 只 有 少量 的 计算 机 程序 。 因 考虑 到 日 前 在 化 学 研究 领域 中 已 有 不 少 有 名 的 专家 系统 ， 在 
本 章 将 选择 一 些 有 代表 性 给 出 必要 的 说 明 ， 以 供 读者 参考 。 

第 一 节 ROR 

人 工 智能 是 一 个 综合 性 的 科技 领域 。 HippeD] 建 议 将 人 工 智能 定义 为 求知 能 力 的 集合 ,这 
种 能 力 是 指 获取 知识 并 用 于 解决 新 的 《未 知 的 ) 理论 和 /或 实际 问题 。 而 人 工 智能 则 是 指 借助 
技术 或 理论 的 手段 , 应 用 数学 方法 和 /或 数理 逻辑 研究 智能 的 各 个 方面 的 问题 n]. 简 言 之 ,人 
工 智 能 就 是 研究 如 何 用 人 工 的 方法 与 技术 ， 即 利用 计算 机 等 工具 ， 模 拟 、 延 什 和 扩张 人 的 智 
能 , 实现 某 些 机 器 思维 或 脑力 劳动 自动 化 5. 人 工 智 能 中 计算 机 和 科学 技术 发 展 的 前 沿 领域 . 
化 学 计量 学 很 自然 地 就 成 为 它 的 应 用 领域 之 一 。 化 学 量 测 及 其 数据 解析 中 ， 如 何 将 各 类 分 析 
仪器 量 测 所 得 的 数据 转化 为 有 用 化 学 信息 , 传统 上 是 依靠 化 学 家 、 分 析 化 学 家 运用 其 智能 、 专 
门 知 识 、 经 验 技巧 及 通过 各 类 计算 来 完成 的 ， 能 否 设计 计算 机 的 专家 系统 ， 来 模拟 化 学 家 和 
分 析 化 学 家 的 脑力 劳 劲 ， 这 就 是 化 学 计量 学 所 涉及 的 人 工 智能 的 任务 。 

本 书 前 述 的 方法 一 般 都 是 数值 运算 ， 面 人 工 智能 所 涉及 的 计算 机 程序 ， 则 更 多 地 涉及 符 
号 与 逻辑 处 理 过 程 。 在 化 学 领域 中 ， 如 何 从 光谱 图 形 〈 包 括 红 外 光谱 、 质 谱 、 核 磁 共 振 谱 
等 ) 出 发 ， 推 断 化 合 物 的 结构 ， 这 些 问题 远 不 是 依靠 单一 数值 运算 可 解决 的 问题 。 人 工 智能 
与 一 般 数 值 运算 的 这 一 区 别 ， 表 现在 人 工 智能 的 计算 机 程序 用 的 是 局 发 式 知识 GE) 与 局 
发 式 搜索 方法 ， 它 借助 于 经 验 规则 ， 或 称 “ 启 发 式 ”规则 ， 以 缩小 搜索 的 范围 。 实际 上 ， 人 
类 专家 在 处 理 问题 时 ， 正 是 这 样 做 的 。 

人 工 智能 的 另 一 特征 是 大 量 引用 领域 知识 。 化 学 计量 学 中 的 人 工 智能 所 涉及 的 领域 知识 
当然 是 化 学 的 专门 知识 ， 这 就 涉及 在 建立 数据 库 的 基础 上 ，、 再 建立 知识 库 、 知 识 表达 及 推理 
FR. 正如 Nilsson HA: “一 个 人 工 智能 产生 式 系统 的 要 素 是 ; 一 个 综合 数据 库 , 一 组 产生 
式 规则 和 一 个 控制 系统 .” 当 前 在 人 工 智能 的 研究 中 , 往往 主张 将 数值 方法 与 基于 知识 推理 的 
人 逻辑 方法 和 启发 式 搜索 方法 进行 柔性 集成 ， 可 望 增强 专家 系统 的 解析 功能 。 但 在 本 章 将 主要 
介绍 常用 的 搜索 方法 及 有 关 知 识 表达 与 推理 规则 ， 并 在 此 基础 上 介绍 几 个 化 学 专家 系统 。 


第 二 节 ”启发 式 分 类 与 搜索 方法 


启发 式 知 识 的 应 用 及 启发 式 近 索 是 专家 系统 不 同 于 其 他 数值 计算 (包括 模式 识别 ) 的 特 
征 之 一 。 启 发 式 知识 是 一 些 不 易 精确 地 用 数学 语言 描述 的 知识 ， 化 学 专家 系统 用 了 化 学 家 的 


427 


经 验 ,例如 谱 图 解析 、 结 构 识别 、 合 成 路 线 设计 等 均 带 有 假设 的 色彩 。 央 发 式 知识 可 定义 为 ， 
有 关 目 前 问题 状况 与 合适 的 解 之 间 的 经 验 性 知识 。 而 启发 式 分 类 是 将 不 同 分 类 层次 上 相互 联 
系 的 概念 ， 用 不 确定 联想 机 制 结合 起 来 ， 启 发 式 分 类 模型 拱 述 了 专家 系统 知识 和 推理 形式 的 
特征 ， 表 达 了 经 验 性 知识 的 组 织 和 使 用 。 

用 人 工 智 能 解决 一 个 问题 ， 常 可 认 作 是 在 各 种 不 同 的 可 能 性 之 问 进行 选择 ， 或 称 “ 搜 
索 ”(search) ， 这 个 搜索 空间 可 以 用 树 的 形式 表述 。 图 10-1 就 是 这 种 搜索 树 … 。 


图 10-1 搜索 树 10-2 逆向 搜索 树 


在 化 学 中 典型 的 问题 是 从 化 合 物 A 出 发 ， 如何 制 取 化 合 物 Do 这 可 能 有 若干 途径 ,但 不 
可 能 由 A 直接 制备 D， 必须 经 过 其 他 中 间 步 骤 , 我 们 的 目标 是 要 找到 最 简捷 的 途径 。 图 10-1 
可 称 为 状态 图 ， 问 题 的 解 的 路 径 是 从 初始 状态 根 结 点 ) 经 过 树 的 分 支 到 达 目 标 状态 (终端 
结 点 ) 。 对 于 大 的 实际 问题 ， 要 绘 出 这 样 的 显示 图 是 十 分 困难 的 ， 因 此 ， 搜 索 树 常 是 “ 隐 式 ” 
的 ， 在 向 目标 搜索 的 进程 中 ,计算 机 程序 将 自动 产生 名 种 可 能 的 分 支 和 结 点 ， 这 里 可 分 为 正 
向 推理 与 北向 推理 两 种 情况 , 即 在 由 起 始 状态 A 向 目标 状态 让 过渡 时 , 图 10-1 是 正 向 推理 ， 
但 也 可 以 逆向 由 目标 状态 朝 起 始 状态 搜索 (图 10-2)。 正 向 推理 亦 称 是 数据 推动 的 , 送 向 推理 
又 称 目标 引导 的 ， 在 用 人 工 智能 辅助 有 机 合成 路 线 设计 时 ， 就 采用 逆向 推理 。 对 于 很 简单 的 
问题 ， 直 接 的 方法 是 进行 “盲目 搜索 ”这 当然 是 很 费时 的 办 法 ， 邮 让 计算 机 依次 产生 并 检验 
各 结 点 可 能 出 现 的 分 支 ， 随 着 搜索 过 程 的 进行 ,搜索 树 不 断 长 天。 以 图 10-1 为 例 ， 每 个 结 点 
可 赋予 一 个 水 平 , 根 结 点 位 于 0 水 平 , 接着 是 水 平 1, 余 类 推 .水 平 的 号 次 代表 了 搜索 的 深度 ， 
这 里 介绍 两 种 盲目 搜索 方法 。 


一 、 广 着 优先 搜索 


这 种 搜索 方法 是 从 根 结 点 出 发 ， 依 次 在 每 一 水 平生 成 并 检验 搜索 树 的 各 结 点 ， 在 一 个 水 
平 的 各 结 点 未 检验 完 ， 即 沿 广度 进行 的 “横向 扫 找 ”未 完成 前 ， 不 开始 生成 与 校 验 更 深水 平 
的 结 点 ( 即 暂 不 “扩展 ”)。 这 里 ， 认 为 同一 水 平 各 结 点 对 问题 的 求解 是 等 价 的， 只 是 按 各 结 
点 生成 的 先后 次 序 ， 先 生成 的 先 检验 ， 沿 “广度 ”遍历 所 有 结 点 ， 然 后 才 按 原 次 序 将 先生 成 
的 结 点 先 往 后 扩展 ， 故 称 为 广度 优先 搜索 法 。 这 种 搜索 法 总 是 能 找到 以 最 简单 步骤 达到 目标 
的 路 线 ， 但 不 一 定 是 最 经 济 的 解决 问题 的 办 法 ， 这 一 点 在 下 面 讨论 启发 式 搜索 时 将 再 论 及 。 
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二 、 深 度 优 先 搜 索 


此 法 进行 搜索 时 ， 是 由 当前 检验 的 结 点 作为 父 结 点 生成 下 一 级 子 结 点 ， 这 样 由 父 结 点 生 
成 子 结 点 的 过 程 继续 下 去 ,看 每 次 丛 验 基 耕 出 现 目 标 结 点 ， 匣 未 出 现 ， 再 扩展 最 晚 生成 的 子 
绪 点 ， 如 此 下 去 ， 沿 着 最 晚 生成 的 子 结 点 分 支 ， 逐 级 “纵向 ”深入 发 展 ， 稚 称 为 深度 优先 搜 
索 法 。 在 到 达 顶 点 仍 未 找到 目标 结 点 时 ,， 往 后 “ 回 湖 ”， 在 前 -个 分 支 从 继续 沿 深度 搜索 。 深 
度 优先 搜索 不 能 保证 一 定 找到 最 短路 径 的 月 标 结 点 ， 央 为 如 果 日 标 结 点 不 在 最 晚 生成 的 子 结 
点 分 支 中 ，- 卫 该 分 支 为 无 穷 分 支 ， 则 搜索 过 程 将 无限 制 地 往 下 进行 ， 即 搜索 失败 ， 深 度 优 先 
搜索 法 有 可 能 在 编制 程序 时 只 存储 当前 搜索 的 路 径 ， 对 计算 机 内 存 要 求 较 低 。 为 改进 深度 优 
先 搜索 法 ， 有 人 引入 “搜索 深度 限制 "， 当 沿 “ 最 晚 ” 分 支 纵 向 搜索 达到 一定 深度 时 、 如 仍 未 
出 现 目标 结 点 ， 则 返回 对 “次 晚 ” 分 支 进行 搜索 ， 这 种 办 法 称 有 界 深度 优先 搜索 法 。 

上 述 讨论 的 盲目 搜索 法 是 正 向 推理 ， 也 可 使 用 逆向 推理 ， 例 如 广 朗 优先 逆向 推理 法 ， 对 
只 要 求 少量 搜索 的 问题 ， 往 往 可 用 这 种 办 法 。 


三 、 启 发 式 搜 索 方法 


总 的 说 来 ， 前 面 讨论 的 言 目 搜索 没有 用 到 所 涉及 问题 的 领域 知识 来 指导 搜索 .对 于 复杂 
的 实际 问题 ， 如 化 学 反应 的 设计 ， 这 种 旋 法 常常 无 法 奏效 ， 即 由 于 排列 组 合 太 多 ， 出现“ 组 
BE”, 即 如 果 平 均 每 个 结 点 可 有 个 分 支 , 则 搜索 空间 将 随 深度 d 的 增加 按 on 关系 增加 。 
解决 的 办 法 是 尽 可 能 借助 领域 知识 的 帮助 ,这 是 人 工 智能 提高 求 问题 解 的 效率 的 基本 雇 穿 . 实 
Е, 人们 在 日常 生活 中 就 是 这 样 做 的 。 虽 这 样 得 到 的 解 不 一 定 就 是 获得 最 优 解 的 最 佳 途径 ， 
但 总 是 在 一 步 步 接近 目标 。 

前 面 叙述 的 广度 优先 搜索 等 方法 ， 未 考虑 搜索 过 程 中 的 “代价 ”问题 ， 只 要 找到 目标 就 
行 。 如 用 加 权 树 表示 各 支 路 的 代价 ， 这 样 可 采用 启发 式 的 代价 驱动 搜索 法 来 求解 代价 最 小 的 
路 径 ， 而 运用 启发 性 知识 一 一 所 求解 问题 的 有 关 知 识 和 经 验 ， 如 有 机 合成 化 学 的 知识 ， 合 成 
实验 的 化 学 专家 的 经 验 ， 可 得 到 解 的 出 现 规律 及 解 的 某 些 性 质 ， 估 计 将 要 支付 的 代价 等 ， 为 
代价 最 小 的 路 径 求解 带 来 很 多 启发 性 提示 .运用 局 发 式 搜索 的 一 种 方法 是 局 部 择优 搜索 法 , 即 
搜索 过 程 中 根据 领域 知识 ,在 一 个 局 部 点 各 可 能 路 径 中 选择 最 有 希望 逼近 目标 结 点 的 方向 , 例 
WE, RELATARE, 即 梯度 函数 最 大 方向 搜索 ,这 在 只 有 单 峰 极 值 的 情况 下 能 奏效 。 
否则 ， 可 用 全 局 择优 搜索 法 ， 在 同一 级 所 有 子 结 点 中 进行 比较 择优 ， 同 时 ， 要 对 当前 结 点 已 
付出 的 代价 & 及 根据 启发 信息 估计 达到 目标 结 点 还 需 付 出 的 代价 进行 权衡, 如 & 的 权 较 大 ， 
搜索 过 程 应 倾向 于 广度 优先 搜索 ， 强 调 横向 扫描 ; 如 六 的 权 较 大 ， 搜 索 过 程 应 倾向 子 深度 优 
先 搜索 ， 强 调 纵向 深入 。 用 这 样 的 指导 思想 ， 能 以 较 低 代价 、 较 高 效率 搜索 到 最 优 解 。 

在 结束 有 关 启 发 式 分 类 与 搜索 的 讨论 之 前 ， 还 要 着 重 指出 启发 式 是 不 确定 的 ， 基 于 典型 
性 假设 的 、 有 了 时 不 易 理解 的 一 种 关系 。 不 确定 性 是 因为 启发 式 认识 跳 过 了 大 量 困 果 关 系 的 中 
间 层 次 ， 而 这 些 中 间 层 次 在 特定 状况 下 可 能 不 成 立 也 可 能 造成 错误 判断 ， 但 正 是 跳 过 了 中 间 
层次 ， 问 题 的 求解 才 跨 出 了 一 大 步 。 


FI 知识 表达 技术 


人 工 智能 研究 者 早 就 发 现 , 强 的 智能 与 其 说 是 由 子 推理 功能 强 , 毋 宁 说 是 直子 知识 丰富 。 
因此 ， 人 工 智 能 将 知识 视 为 高 效 智 能 系统 的 关键 要 素 ， 知 识 的 表达 与 管理 就 成 了 人 工 智能 研 
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帘 的 中 心 课题 之 一 。 知 识 可 定义 为 具有 智能 的 人 或 机 器 能 出 以 作出 合理 决策 的 信息 。 知 识 表 
达 是 指 知识 的 表 泵 与 描述 ， 亦 即 知 识 的 形式 化 或 模型 化 ， 

知识 有 叙述 型 、 过 程 型 与 控制 型 等 几 种 类 型 。 令 述 型 知识 叙述 关于 系统 的 状态 、 环 境 和 
条 件 ， 问 题 的 构想 、 定 义 、 事 实 等 ; 过程 型 知识 袁 述 有 关系 统 状态 的 变化 、 问 题 求解 过 程 的 
REF: 控制 型 知识 提供 如 何 选 择 相应 的 操作 、 运 算 和 行动 的 信息 。 可 用 于 叙述 型 知识 的 表 
达 方 法 有 逻辑 表达 法 、 语 义 网 络 表达 法 等 ， 而 能 用 于 表达 过 程 型 知识 同时 又 能 表达 其 他 类 型 
知识 的 表达 方法 ， 最 典型 的 是 产生 式 规则 表达 法 。 下 面 将 举例 简要 介绍 这 三 种 知识 表达 
方法 。 


一 、 逐 辑 表达 法 


下 面 是 一 个 逻辑 表达 的 例 于 

(D V x[metal(z)—conduct (z) ]; 

@ metal (гоп); 

(& conduct (iron), 

此 例 中 Y = [metal (z)—conduct (z) ] 表示 所 有 的 金属 都 导电 ，metal Gron): 表示 铁 是 
#0, conduct (топ) 表示 铁 导 电 ， 全 句 意义 为 : 所 有 的 金属 都 导电 ， 因 为 铁 是 金属 ， 所 以 铁 
TE., Elt, meal (x》 表 示 zx 是 金属 ,是 谓词 逻辑 中 的 一 个 原 于 谓词 公式 ,xz 是 客体 变 元 ， 
它 可 以 有 一 个 定义 域 ， 称 为 客体 域 ， 而 Y x (数学 上 表示 任 取 z) 称 为 “全 称 量词 *， 表 示 客 
体 域 中 的 所 有 个 体 。 注 意 , 一 个 谓词 通常 还 可 以 有 若干 个 客体 变 元 IPFE 
Tn) ШЕЯ р 称 为 ”元 谓词 。 更 复杂 的 情况 还 有 . 谓词 bp (x》 中 的 变 元 x 本 身 叉 可 以 
为 一 谓词 (有 点 类 似 函 数 中 的 复合 函数 ，， 此 时 称 x 为 一 阶 谓词 ， 而 p GO 则 称 为 二 级 
谓词 。 所 以 ， 知 识 的 逻辑 表达 通常 是 指 一 阶 谓词 逻辑 CFOPLO 描述 人 工 智能 问题 。 谓词 
逻辑 表达 较 严谨 精确 ， 具 有 通用 性 ， 接 近 自 然 语言 ， 但 使 用 效率 低 ， 灵 活性 较 差 ， 常 使 
推理 过 程 宛 长 。 


=. Жуй АЕ 


语义 网络 表达 是 通过 概念 及 其 语义 关系 用 网 络 图 表达 知识 ， 用 以 描述 样本 、 事 件 、 概 念 
等 的 关系 。 网 络 图 实际 上 是 图 的 一 种 ， 称 有 向 图 ， 有 向 图 中 从 一 个 作为 起 点 的 结 点 到 作为 终 
点 的 结 点 的 线 称 为 弧 。 滞 义 网 络 起 初 是 为 描述 人 关 m 
记忆 的 心理 学 模型 提出 的 ， 在 自然 语言 研究 中 ， 表 | жалан 
示 复 杂 句 型 的 语义 很 方便 。 语 义 网 络 中 结 点 表示 对 


象 、 概 念 或 事件 ， 弧 可 用 不 同方 式 定义 ， 这 取决 于 + 

被 表示 的 知识 ,用 于 表达 化 学 结 梅 的 普通 弧 有 isa 和 = = 
has-part， 例 如 酮 作为 一 种 有 机 化 合 物 概 念 的 表述 fsa 
(810-2, ER, MOREAREN NER LL] 


层 上 存储 一 次 ， 而 不 是 在 各 个 特定 的 痢 这 样 较 低层 
次 上 重复 存储 。 通 过 有 关 弧 会 义 的 知识 ， 可 以 搜索 图 10-3 柄 作为 有 机 化 合 物 概念 的 语义 网 络 
了 网络 ,推出 “了 丁 酮 含有 妆 基 ”这 样 的 事实 。 这 种 表述 法 在 推理 过 程 涉及 较 复杂 的 推理 时 有 用 
它 较 自然 ,体现 了 联想 思维 过 程 ， 表 达 语 义 关系 知识 效率 较 高 ， 但 不 及 轴 辑 方法 严谨 ， 不 便 
于 表达 判断 性 知识 及 动态 知识 。 


三 、 产 生 式 规 则 表达 法 


这 是 人 工 智能 用 于 解决 化 学 课题 常用 的 知识 表达 方法 ， 这 种 表达 方法 包含 : 

CD 存储 有 关 问 题 的 状态 、 人 性质 的 叙述 性 知识 的 综合 数据 库 , 或 称 事实 库 ; D 存储 有 关 状 
态 转移 等 规则 的 过 程 性 知识 的 规则 集 , 或 称 规则 库 ; GO 用 于 选择 控制 策略 ， 将 规则 与 事实 进 
行 匹配 、 控 制 利用 知识 推理 求解 问题 的 控制 器 。 

最 简单 的 产生 式 规则 有 如 下 格式 : 


IF (HOR) THEN (WJ) 
前 提 结论 
条 件 行动 
例如 ， 在 代 F 助 化 学 反应 推测 结构 时 ， 可 将 脱水 反应 表示 为 如 下 规则 
IF 存在 模式 С--С- О 


ТНЕК 转换 为 模式 CHC 

这 是 脱 去 一 个 H,O 的 结构 (H 原子 均 已 略 去 ). 产生 式 系统 求解 问题 的 过 程 , 是 使 事实 库 
转移 到 满足 解 的 终止 条 件 的 状态 。 一 条 产生 式 规则 的 前 提 部 分 可 以 是 能 和 事实 库 进 行 匹配 前 
任何 模式 ， 车 一 条 规则 的 前 提 部 分 被 匹配 ， 则 该 规则 即 届 可用; 使 用 一 条 规则 的 结果 是 得 到 
一 个 结论 或 产生 一 个 行动 (如 将 C—C—O 转化 为 C 一 C), 这 将 使 事实 库 的 状态 发 生 转 移 . Б 
制 器 按 相 应 策略 ， 控 制 规则 与 事实 的 匹配 过 程 ， 有 效 地 求解 所 涉及 的 问题 。 

产生 式 系 统 具 有 通用 性 ， 接 近 人 的 自然 推理 方式 ， 易 为 用 户 理解 。 产 生 式 规则 可 自由 增 
删 、 修 改 ， 便 于 用 户 自行 加 人 领域 知识 ， 但 简单 的 产生 式 系统 各 规则 独立 ,求解 复 杂 问 题 时 
会 出 现 “ 组 台 爆 炸 ”， 因 而 效率 不 高 ， 表 达能 力 亦 不 够 强 . 需 进 行 扩充 ,使 其 前 提 不 限于 简单 
的 事实 而 是 事实 、 情 况 和 条 件 的 综合 模式 。 

除 上 述 三 种 知识 表达 技术 外 ， 还 有 许多 别 的 知识 表述 方法 、 如 状态 空间 表达 法 ,将 有 关 
初始 状态 、 日 标 状态 ， 及 由 及 者 达到 后 者 所 需 的 “操作 ”用 符号 形式 表 出 ， 或 用 有 向 图 ( 称 
状态 空间 图 ) Ris 特征 表 表达 法 。 即 以 表格 形式 表达 样本 特征 ,以 用 于 检索 ， 框架 表达 法 ， 
以 各 种 大 、 中 、 小 框架 ,互相 内 外 贬 套 组 合 表达 状态 变化 与 所 作 过 程 ;与 /或 图 表达 法 ， 这 苦 
一 种 超 图 ,通常 以 树 的 形式 , 亦 称 与 /或 AND/OR) B. 这 种 表达 知识 的 方法 基于 人 们 求解 
问题 时 的 两 种 思维 方法 。AND 树 ， 用 于 分 解 ， 将 复杂 的 大 问题 分 解 成 一 组 简单 的 小 问题 ， 将 
总 问题 分 解 为 子 问题 ， 若 所 有 的 子 问题 解决 了 ， 总 问题 亦 告解 决 ， 子 问题 解决 不 了 的 又 可 继 
续 分 解 《图 100; OR 树 ， 用 于 变换 ， 将 较 难 的 问题 变换 为 较 易 的 等 价 的 问题 ， 后 者 如 能 解 
决 ， 原 有 难题 亦 告 解决 《图 10-5)。 实 际 求解 问题 可 兼用 二 法 ， 即 AND/OR 树 表达 法 。 


复杂 的 大 问题 SEIS HUM 

简单 的 小 问题 容易 问题 

子 子 问题 Ө; 更 容易 的 问题 
图 10-4 AND # 图 10-5 OR 


知识 表达 仍 是 一 个 人 工 智能 领域 尚 在 继续 研究 完善 的 领域 ,如 知识 表达 方式 的 标准 化 ,不 
精确 的 知识 的 表达 ， 表 达 效 率 的 评估 ， 知 识 的 量化 等 方面 部 有 待 完善 。 


WES 化 学 专家 系统 


一 、 化 学 专家 系统 的 基本 结构 与 特点 


专家 系统 足 人 工 智 能 的 一 个 重要 分 支 。 从 计算 机 人 工 智 能 的 角度 分 析 问 题 ， 任 何 用 到 大 
的 化 学 知识 库 的 复杂 的 人 工 智能 系统 都 可 认 作 化 学 专家 系统 .也 就 是 说 ， 用 于 解决 实际 化 学 
问题 的 人 工 智能 系统 均 是 化 学 专家 系统 ， 可 能 “化 学 知识 系统 ”是 一 个 更 确切 的 名 词 。 

专家 系统 在 化 学 中 的 应 用 极其 广泛 ， 在 谱 图 解析 、 分 离 科学 、 分 析 方法 的 选择 、 仪 器 控 
制 等 方面 都 产生 了 很 多 有 名 的 化 学 专家 系统 (参见 表 10-1)。 

# 10-1 国内 外 较 知名 的 化 学 专家 系统 


系统 名 称 | 作 | Bu £ х ® 
DENDRAL | J. Lederberg ‚ 美国 N 5,6 
CHEMICS kA Er 7 
CASE M.E. Munk 等 жщ 8 
PAIRS H. Woodruff 等 Xm 9,10 
STREC L.A, Gribov 等 前 苏联 谱 图 解析 ,MS, “C-NMR, 'H NMR,UV 等 11 
CARDON J. Zupan 等 ! 南斯拉夫 谱 图 解析 .2C-KMR 12 
| wes | 中 国 色谱 专家 系统 1847 
ESESOC Tem 中 国 АЯТ. ЗС NMR.MS.IR | 13915 
PLATO Curry 等 美国 РЖ т. 0С NMR,MS,IR і 18 
LHASA | W. Kaufman fi ; 有 视 合 成 系统 19 
开发 始 于 20 世纪 60 年 代 的 DENDRAL 9] ERU RRS ATH SER Е 
的 一 个 标志 ， 它 由 美国 斯 坦 福 大 学 创建 ， 是 一 个 有 机 分 析 化 学 系统 ， 可 从 量 测 到 的 有 机 化 合 
物 的 质谱 数据 出 发 ， 一 直到 产生 出 化 合 物 的 结构 图 。 现 以 这 一 化 学 专家 系统 为 例 ， 说 明 化 学 


专家 系统 的 基本 结构 。 一 般 说 来 ， 一 个 化 学 专家 系统 应 包括 如 下 组 成 部 分 : 

G) 化 学 知识 库 或 化 学 知识 源 ) ”包括 相关 化 学 领域 的 事实 、 与 问题 有 关 的 崩 发 推理 
等 。 DENDRAL 系统 的 知识 库 中 包括 从 实验 测 得 的 质谱 数据 导出 的 有 关 有 机 化 合 物 分 子 结构 
的 限制 的 规则 哪些 结构 可 能 存在, 哪些 结构 可 能 不 存在 ); 产生 能 满足 这 些 限 制 的 可 能 结构 
的 方法 ; 从 结构 预测 其 质谱 的 规则 等 ， 最 常用 的 表达 化 学 知识 的 方法 是 前 述 产 生 式 规则 。 

(2) 推理 步骤 或 控制 结构 ”用 于 利用 化 学 知识 解决 相关 问题 . DENDRAL 系统 用 向 前 搜 

(3) 工作 内 存 区 或 称 “ 全 局 数 据 库 ” 存储 所 处 理 的 问题 的 当前 信息 , 包括 输入 的 数据 、 
已 得 到 的 结果 等 。 DENDRAL 系统 工作 时 的 全 局 数据 库 ， 是 质谱 数据 、 产 生 的 结构 限制 、 可 
能 的 结构 等 。 

从 化 学 专家 系统 的 结构 ， 可 以 看 出 它 明显 不 同 于 一 般 前 述 的 化 学 计量 学 数值 计算 方法 之 
处 ， 是 将 有 关 的 一 般 化 学 知识 、 规 则 与 当前 课题 的 信息 〈 输 人 数据 )， 以 及 用 一 般 知识 解决 当 
前 问题 的 方法 〈 规 则 解析 器 》 明确 分 开 ， 这 样 ， 化 学 专家 系统 易于 接受 新 的 化 学 知识 并 适应 
新 的 情况 ， 以 解决 新 的 问题 。 化 学 专家 系统 的 基本 结构 示意 询 于 图 10-6, 

要 构造 一 个 化 学 专家 系统 ,还 必须 满足 下 述 前 提 : D 至 少 目前 有 化 学 专家 能 很 好 地 解决 
涉及 的 问题 ; © 化 学 专家 解决 涉及 的 问题 应 是 来 源 于 特殊 知识 , 判断 能 力 与 经 验 ; @ 化 学 专 
家 应 能 解释 他 所 用 的 特殊 知识 、 经 验 诀窍 和 解决 问题 的 方法 ; 只 涉及 的 任务 应 有 明确 的 应 用 
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对 象 与 范围 HWE TERRA, 2-56). FRAN E 
家 合作 构造 的 解析 质谱 及 其 他 波谱 的 DENDRAL 等 化 学 专家 系统 , 即 是 在 具备 相应 前 提 条 件 
下 构造 的 。 


用 户 
x 
自然 语言 接口 
控制 结构 i 
NRR 
| NEL 
化 学 知识 库 = ЖА 
化 学 知识 规则 |- 一; 全 局 数 据 库 —| wm 
化 学 推理 规划 


GERERE 


图 10-6 化 学 专家 系统 的 基本 结构 
以 下 将 简要 介绍 几 个 化 学 专家 系统 。 


=. DENDRAL 质谱 、 核 磁 共 振 谱 图 解析 专家 系统 


DENDRAL 质谱 、 核 磁 共 振 谱 图 解析 专家 系统 由 诺 贝尔 奖 获 得 者 Lederberg 主持 开发 .可 
以 说 是 化 学 专家 系统 ， 甚 至 是 专家 系统 这 一 人 工 智能 的 主流 分 支 诞 生 的 一 个 标志 。 它 主要 包 
括 3 个 子 系统 ， 

(D 启发 式 DENDRAT 系统 ; 

Q 结构 生成 CONGEN 系统 ; 

9 “Meta-DENDRAL” RA. 

ЖД ЖЕКЕ Ж Lederberg 曾 致 力 子 研究 用 拓扑 学 表征 化 学 结构 中 。 一 个 给 定 的 化 学 成 
分 ， 有 多 少 可 能 的 结构 ? Lederberg 曾 用 LISP 语言 编制 递归 算法 研究 了 从 原子 集合 产生 所 有 
的 非 环形 分 子 结构 。 启 发 式 DENDRAL 系统 就 包括 了 这 些 非 环形 和 环形 分 子 结构 的 穷 举 程 
序 ， 其 数据 调整 器 从 质谱 图 中 检 出 对 结构 生成 有 重要 意义 的 质谱 峰 ， 预 推理 器 根据 质谱 峰 进 
行 初步 分 析 ， 判 断 化 合 物 属 于 哪 一 类 ;， 结构 生成 器 根据 预 推理 器 输出 的 信息 ， 生 成 对 应 于 质 
谱 图 的 所 有 可 能 的 分 子 结构 ， 将 其 列 人 可 能 分 子 结构 候选 表 ， 预测 器 给 出 候选 结构 的 预测 质 
谱 图 , 然后 将 预测 质谱 图 与 原 谱 图 比较 , 检查 二 者 符合 情况 ,， 按 评价 函数 决定 其 符合 程度 , 以 
便 按 符合 程度 输出 候选 分 子 结构 。 

结构 生成 CONGEN (限制 发 生 器 ) 系统 ， 于 20 世纪 70 年 代 中 期 设计 ， 以 取代 原 
DENDRAL 系统 的 非 环形 和 环形 的 分 于 结构 的 穷 举 程序 , 所 以 , CONGEN 是 一 个 功能 更 强 的 
限制 性 的 分 子 结构 生成 器 。 通 过 人 -机 交互 ， 使 用 CONGEN 的 化 学 家 可 以 随时 方便 地 输入 启 
发 信息 ， 对 分 子 结构 的 生成 过 程 加 人 约 东 条 件 . CONGEN 还 增加 了 对 立体 异 构 的 考虑 。 新 的 
CONGEN 程序 系 按 深度 优先 搜索 编制 ， 并 允许 化 学 家 使 用 时 提前 停止 计算 。 

“Meta-DENDRAL” 系 统 是 一 个 能 够 自动 建立 化 学 知识 库 的 学 习 系 统 ,这 对 本 身 理论 尚 不 
完善 的 质谱 解析 来 说 有 特别 意义 。 在 质谱 结构 解析 专家 系统 构造 中 ， 如 何 使 质谱 解析 专家 的 
知识 和 经 验 明 确 化 、 系 统 化 , 表述 为 产生 式 规则 , 本 身 就 是 一 个 难题 。“Meta-DENDRAL” 系 
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统 通 过 向 样品 质谱 学 习 ， 自 动 进行 归纳 处 理 。 
例如 ， 一 个 简单 的 质谱 烈 解 规则 R1 为 
R1; N—C—C—C€ —>N--€°C -C 
CD IRA fi БА xh Ve A} РРБ: 
四 对 于 每 个 匹配 ， 将 分 子 在 规则 右边 加 星 号 标记 的 键 断 开 ; 
C 保留 星 号 左边 的 部 分 〈 鲍 如 保留 人 一 C)， 并 记录 保留 部 分 的 质量 。 
在 一 个 大 分 子 里 ,规则 有 R1 可 多 次 使 用 ,例如 ,CH: 一 CH: 一 CH NH- CH;—CH,—CH;— 
CH, 的 谱 线 ， 包 含 数据 点 质量 在 ?2 和 86、 使 用 这 个 规则 导出 两 个 分 烈 碎片 : 
CH 一 CH 一 CH 一 NH 一 CH: * 
* CH, —2H—CH,—CH,—CH, CH, 
“Meta-DENDRAL” 系 统 通过 学 习 ， 从 已 知 化 合 物 的 质谱 图 归纳 出 有 机 化 合 物 的 裂解 规 
则 ， 学 习 过 程 示 于 图 10-7。 


—— 
| 
| 


解释 INTSUM 


| P ` 
RULEMOD Lo x 模拟 
Те s ER 
NI T 
RULEGEN HRANE 
| Le 


图 10-7 Meta-DENDRAL 的 学 习 过 程 


首先 , 由 解释 程序 INTSUM 从 训练 集 总 结 出 初步 的 裂解 规则 , 每 个 分 子 通过 寻求 能 够 解 
释 每 个 质谱 峰 产生 原因 的 一 个 或 多 个 裂解 过 程 ， 为 该 分 子 说 明 其 质谱 中 的 每 个 峰 ， 利 用 下 述 
限定 条 件 可 限制 应 取 的 裂解 过 程 数 目 : 

第 一 ， 只 考虑 其 裂解 碎片 与 质谱 蜂 的 质量 数 相对 应 的 断裂 。 

第 二 ， 质 谱 领 域 的 语义 模型 限制 ， 即 只 考虑 半 阶 理论 允许 的 裂解 。 

在 质谱 领域 知识 的 语义 模型 中 ， 有 所 谓 零 阶 理论 ， 这 是 指 分 子 内 部 每 个 键 的 子 集 都 能 断 
裂 ， 但 这 个 班 论 不 足以 限制 搜索 范围 ， 因 此 ， 把 某 些 通用 的 指导 方针 强加 在 它 上 面 ， 称 半 阶 
理论 。 这 一 理论 断言 在 质谱 分 析 过 程 中 ， 一 些 将 要 断 开 面 且 原子 将 迁移 ， 关 于 裂解 有 如 下 限 
dj. © 双 键 和 三 键 不 断 开 ;加 芳烃 键 不 断 开 ， 图 在 数据 中 只 应 出 现 比 两 个 碳 原子 还 大 的 裂 
解 碎片 © 相同 碳 原 子 的 两 个 键 不 能 同时 断 开 ; S 在 任 一 次 裂解 中 , 断 开 的 键 不 能 多 于 一 个: 
© 在 一 个 过 程 中 不 会 出 现 多 于 两 次 的 完全 裂解 ; 人 在 多 步 过 程 中 最 多 只 有 了 两 个 环形 裂解 碎 
片 。 关 于 原子 迁移 有 如 下 规则 : © 在 一 次 烈 解 之 后 , 至 多 有 两 个 氢 原 子 能 够 迁移 ; © 在 任 一 
次 裂解 之 后 ， 至 多 脱 除 一 个 HOO © 在 任 一 次 裂解 之 后 ， 损 失 至 多 不 过 一 个 CO 单位 。 

语义 模型 是 化 学 与 质谱 学 基本 知识 及 专家 经 验 的 总 结 。 利 用 语义 模型 ， 化 学 质谱 专家 训 
Б Ж їй И ЕТТ БИ ЖА ЖЕ ЖЕТЕ, ҮН + ЖОШ ЕДЫ. Æ INTSUM 总 结 出 初步 兵 解 规则 之 后 ， 
“工作 ”环节 根据 裂解 规则 形成 模拟 质谱 ,“ 比 较 ” 环 节 将 模拟 质谱 与 实际 质谱 进行 比较 ， 驱 
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动 “ 学 习 ” 环 节 。 学 习 环 节 中 有 RULEGEN (规则 产后 ) 与 RULEMGOD (规则 修正 ) 两 个 程 
序 .RULEGEN 寻找 较 INTSUM 产生 的 初步 施 解 规则 更 一 般 的 规则 集 , 它 不 仅 要 符合 已 有 的 
样本 ， 还 可 解释 新 的 质谱 数据 ， 即 一 般 的 规则 应 能 正确 解释 质谱 中 很 多 数据 点 〈 正 的 证 据 )， 
也 可 预测 一 些 在 任意 图 谱 中 都 不 出 现 的 峰 《 负 的 证 据 ). LEO GE RB oe ae ШЕЙ 
引进 的 负 的 证 据 则 由 RULEMOD 通过 规则 合并 、 消除 实 余 等 方法 进行 修正 , 假设 某 一 次 已 成 
功 地 使 用 了 一 次 规则 , 一 旦 这 个 规则 中 还 有 一 个 不 合适 的 例子 . RULEMOD 能 适当 地 修改 这 
个 规则 。 这 里 系统 的 输入 是 样本 质谱 与 语义 模型 ， 而 输出 的 是 关于 分 子 结构 分 裂 过 程 的 产生 
式 规则 集 。 最 后 ， 将 得 到 的 裂解 规则 存储 于 知识 库 。 

可 以 看 出 ， 上 述 学 习 过 程 体现 出 专家 系统 程序 向 训练 集 样 本 学 翌 ， 而 同时 也 吸收 了 化 学 
与 质谱 专家 的 知识 与 经 验 。 

“Meta-DENDRAL” 的 应 用 , 不 但 确证 了 一 些 过 去 已 发 现 的 质谱 测定 法 的 规则 ,而且 还 发 
现 了 一 些 过 去 未 报道 的 篆 烷 分 子 的 新 规则 .“Meta DENDRAL” 系统 让 用 于 "C-NMR 的 解析 。 


三 、PLATO 数据 解析 专家 系统 


PLATO 数据 解析 专家 系统 (GC;IRZMS) di Curry 等 开发 * ,其 结构 框图 如 图 10-8 BER 
其 系统 主要 由 四 部 分 所 组 成 ， 
cL 控制 -推理 器 和 模块， 

O 数据 库 管 理 模块 ; 
d 分 子 结构 编辑 模块 ; 

JL 数据 专家 模块 。 

这 个 系统 二 要 用 于 GC/IR/MS 数据 的 
自动 解析 . 其 中 “数据 专家 ”主要 模拟 谱 图 
学 家 收集 和 解析 数据 ;“ 控 制 器 ” 则 在 系统 
中 起 化 学 家 所 起 的 作用 ;“ 库 符 理 ”是 对 谱 
图 库 中 的 谱 图 、 结 构 及 子 波谱 进行 管理 和 
检索; 而 “结构 编辑 " 则 是 完成 结构 的 分 解 、 
装配 和 显示 的 任务 。 

该 系统 是 一 个 分 布 式 专家 系统 ， 其 各 
序 模 决 可 以 并 行 运 行 , 故 可 加 快 解析 速度 ， 
另外 ， 该 系统 可 对 各 种 不 同类 型 的 数据 进行 处 理 ， 且 可 根据 不 同 的 数据 类 型 选用 不 同 的 数 
据 分 析 算法 。 该 系统 允许 用 户 干预 或 控制 某 一 问题 解析 的 全 过 程 ， 如 光谱 的 归属 、 官 能 团 约 
东 以 及 于 结构 的 装配 ， 且 系统 与 用 户 间 的 交互 作用 是 完全 遵循 人 类 专家 演绎 推理 的 过 程 和 原 
则 来 进行 的 ， 

(一 ) 数据 专家 

该 系统 的 数据 专家 为 一 独立 模块 , 主要 由 三 部 分 组 成 : QU 红外 “数据 专家 ”(IR expert); 
O 质谱 “数据 专家 ”(MS expert); © 数据 库 专家 (data experD 。 此 三 部 分 子 模块 可 进行 相 
互 交 换 与 连接 ， 还 可 相互 调用 。 

(二 ) 控制 器 

控制 器 是 PLATO 的 心脏 , 它 的 功能 就 像 一 个 化 学 家 , 如 设 定 分 析 的 目的 , 组 织 “ 数 据 专 
家 ”， 并 把 “数据 专家 ”所 得 结果 进行 综合 ， 以 求 得 问题 的 最 终 答 案 。 


图 10-8 PLATO 系统 框图 
БИРЕ ЖЛЕ НЕК 
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(=) 知识 库 

Y& PLATO 系统 中 , 知识 库 以 层次 方式 组 织 了 1009 个 化 学 子 结构 , 知识 库 中 的 每 一 项 为 
一 “化 学 类 ”， 它 们 包含 了 最 重要 的 有 机 官能 团 ， 泳 知识 库 分 布 在 所 有 PLATO 的 模块 中 ,但 
维护 和 更 新 则 统一 由 控制 器 进行 

知识 库 包含 了 所 有 重要 的 与 红外 光谱 相关 的 子 结构 ， 辣 时 也 包含 了 质谱 和 核磁 共振 席 系 
统 中 的 主要 子 结构 。 谱 图 的 手段 不 同 ， 对 于 子 结构 的 长 达 之 侧重 亦 各 水 相同 ， 如 红外 所 侧重 
的 是 官能 团 , 质谱 侧重 的 为 元 素 的 组 成 . 而 :5C- 核 磁 共 振 谱 CNMR) 则 侧重 碳 原子 的 局 部 化 学 
环境 。 对 系统 的 查询 ， 所 得 结论 以 及 对 结论 的 解释 均 以 这 些 于 结构 为 基础 。 


四 、 高 效 液 相 色谱 专家 系统 


此 高 效 液 相 色谱 专家 系统 由 中 国 科 学 院 大 连 化 学 物理 研究 所 开发 "*!”， 是 一 个 与 色谱 仪 
器 直接 联 用 的 集成 系统 ， 由 以 下 几 个 子 系 统 所 组 成 ， 

@ 全 自动 化 高 歼 液 相 色 谱 仪 ; 

D 高 效 液 相 色谱 样品 预 处 理 及 最 佳 性 系统 推荐 模块 ; 

D 高 效 液 相 色 谱 最 佳 分 离 条 件 优 化 模块 

@ 高 效 液 相 色 谱 谱 图 库 及 其 验证 模块 

D 高 效 液 相 色 详 定 性 定量 数据 处 理 模块 。 

这 些 子 系统 既 各 自 自 成 体系 , 相 科 之 间 又 可 连接 和 相互 交流 , 是 一 个 有 机 的 整体 条。 该 
系统 从 20 世纪 во 年 代 初 开始 开发 ， 历 经 10 年 方 得 以 完 

该 系统 的 作者 认为 ,一 个 完整 的 高 效 被 相 色 谱 专 家 系统 应 当 包 括 样品 顶 处 理 方法 推荐 .最 
佳 柱 系统 推荐 、 操 作 条 件 优化 以 及 色谱 数据 的 定性 定量 ， 而 且 更 为 重要 的 是 这 些 模块 之 间 有 
机 联系 。 作 者 指出 ， 某 些 复 杂 样 本 需 作 适 当 预 处 理 ， 使 得 其 变 得 容易 分 离 和 检测 ， 进 而 使 得 
推荐 的 柱 系统 更 佳 , 而 只 有 当 推荐 的 柱 系 统 最 佳 , 继而 进行 的 操作 条 件 优化 才 有 真正 的 价值 ; 
反 过 来 ， 也 只 有 是 在 最 佳 条 件 比较 不 同 的 柱 系统 所 得 结果 才 有 效 ， 故 预 处 理 、 柱 系统 选择 和 
操作 条 件 优化 是 不 可 完全 分 立 的 。 如 果 还 更 深层 次 考虑 ， 色 谱 的 定性 库 不 仅 可 用 于 谱 图 库 中 
谱 峰 的 定性 ， 还 可 以 用 于 条 件 优 化 ， 再 进一步 来 比较 不 同方 法 之 间 抑 差异 ， 得 选 出 最 佳 方案 
来 改善 柱 系统 的 推荐 。 所 以 ， 上 述 稚 家 系统 的 几 个 子 系统 必须 有 机 地 结合 起 来 ， 在 充分 发 挥 
它们 各 自动 能 的 基础 上 ， 还 必须 进行 全 面 合 理 安排 。 一 方 而 需要 一 个 总 体 控制 模块 来 控制 选 
择 调 用 专家 系统 中 的 每 一 个 子 系 统 ， 另 一 方面 还 需 考虑 每 一 模块 之 问 的 相互 连接 ， 使 每 一 模 
埃 之 间 能 够 相互 调用 ， 共 享 数据 库 和 谱 图 库 "” , 

我 们 将 该 专家 系统 的 各 模块 称 为 子 系统 是 办 为 前 述 的 各 模块 都 可 相应 的 看 成 一 个 独立 的 
专家 系统 ， 因 为 它们 各 自 都 具有 专家 系统 所 需 的 各 要 素 ， 即 它们 都 具有 自己 的 化 学 知识 库 
(或 化 学 知识 源 )， 自 己 的 推理 步骤 或 控制 结构 以 及 数据 库 等 。 有 关 该 系统 的 详细 介绍 ， 读 者 
TSAR. 


E. ESESOC 有 机 化 合 物 结构 解析 专家 系统 


该 系统 由 中 国 科学 院 长 春 应 用 化 学 研究 所 开发 .于 ,其 结构 框图 如 图 10-0 所 示 , 其 解析 
过 程 队 逻辑 上 可 分 为 三 步 ; 

(OD 由 实验 数据 (如 质谱 、 核 磁 共 振 波 谱 和 红外 光谱 等 ) 或 者 由 化 学 信息 《如 分 子 式 ) 出 
A. CARE 〈 如 谱 图 -结构 相关 规则 》 中 获得 化 合 物 结构 碎片 集 
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的 对 搂 ， 生 成 各 种 可 能 的 分 子 异 构 体 ， 得 候选 化 合 物 ， 


图 在 波谱 模拟 、 分 子 张力 能 计算 ,-C 谱 峰 信息 ,模式 识别 及 人 机 交互 信息 等 的 作用 下 ， 


进行 候选 化 合 物 的 验证 ， 直 至 将 最 可 能 的 结构 输出 。 


] 
实验 数据 | | | 数 
MSNMR,IR 等 | ^75 Йй 


— A 
ТЕТ 


| жя | oo : 
| i ТЕТ 
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结构 验证 Jedem 
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图 10-9 ESESOC 系统 的 基本 结构 
在 上 述 步骤 中 ， 他 们 认为 核心 部 分 是 结构 发 生 器 ， 因 为 必须 要 求 结构 发 生肉 所 产生 的 候 


选 化 合 物 是 遍历 所 有 可 能 结构 ， 亦 即 穷 举 且 无 元 余 的 。 在 此 步 中 需 灵 活 运用 图 论 、 离 散 数 学 
和 拓扑 学 等 手段 ， 是 该 系统 较 难 的 一 部 分 。 另 一 方面 ， 因 随 着 化合物 原子 数 的 增 大 ， 还 将 遇 
到 “组 合 爆炸 ”的 问题 ， 使 穷 举 难于 实现 ， 确 为 此 类 系统 的 难点 问题 。 


有 关 该 系统 的 详细 信息 ， 可 参阅 文献 [14]。 
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$T—3* ”统计 学 和 应 用 数学 基础 知识 


因 本 书 讨 论 的 有 关 化 学 计量 学 的 方法 用 到 不 少 组 性 代数 种 统计 学 知识 ， 而 且 有 些 知识 在 
一 般 数学 教科 书 上 还 很 难 找到 ， 为 使 本 书 成 为 一 个 封闭 系统 ， 故 将 一 些 必要 的 线性 代数 和 统 
计 学 知识 收录 于 此 ， 汇 成 一 章 供 读者 参考 。 

在 介绍 这 些 知识 之 前 ， 先 讨论 一 下 化 学 曼 测 数据 的 矢 其 和 甜 阵 表 示 方 法 。 在 分 析 化 学 的 
测量 中 ， 一 个 化 学 样本 一 般 都 可 由 一 个 谱 米 表 术 .如 常见 的 光谱 ,色谱 ， 各 类 波谱 和 各 种 电 
化 学 谱 。 将 这 些 谱 离 散 化 ， 就 可 得 到 一 组 数据 ， 这 组 数据 就 相当 于 数学 中 的 矢量 。 如 果 我 们 
把 很 多 样本 收集 在 一 块 ， 就 可 得 到 一 个 盾 阵 。 一 般 说 来 ， 在 这 样 的 数据 矩阵 中 ， 对 一 个 样本 
量 测 所 得 到 的 一 个 谱 可 置 为 一 个 行 矢量 ,这 样 的 行 矢量 可 称 为 一 个 样本 对 象 或 一 个 样本 ; 与 
之 类 似 ， 在 这 样 的 数据 和 矩 阵 中 ， 一 个 变量 《如 一 个 分 析 通 道 ， 一 个 波长 等 ) 可 和 置 为 一 个 列 矢 
d. 这 样 的 列 矢 量 可 称 为 一 个 变量 (variable), 本 书 所 论 及 的 大 少数 化 学 计量 学 方法 , BEB 
立 在 这 样 的 矢量 和 和 未 了 泗 之 上 的 ， 所 以 有 关 矢 量 种 第 阵 运算 的 线性 代数 基础 知识 对 化 学 计 革 守 
就 显得 特别 重要 了 。 另 一 方面 ， 由 于 在 分 析 量 测 中 总 得 与 量 测 误差 打交道 ， 怎 样 来 估价 这 些 
随机 误差 对 量 测 数 据 的 影响 ， 这 就 得 需要 统计 学 知识 ， 在 本 书 讨论 的 是 多 变量 化 学 计量 学 方 
法 ,特别 需要 多 元 统计 知识 。 


第 一 节 ”统计 学 基础 知识 
一 、 随 机 事件 的 概率 公式 


(C 路 机 事件 及 其 概率 

在 一 定 的 条 件 下 ,现象 4 可 能 发 生 ,也 可 能 不 发 生 , R HE XA Т B A 的 事件 叫做 随 
机 事件 4， 简 称 事件 4。 如 果 在 既定 的 条 件 下 进行 一 组 试验 , 总 共 试验 次 其 中 现象 a 发 
ETN K, 则 该 组 试验 中 事件 4 的 频率 为 NIN), 重复 进 行 很 多 组 这 样 的 试验 ,可 发 现 
随机 事件 的 频率 具有 某 种 规律 性 , 如 果 从 统计 意义 上 说 , 随机 事件 的 频 谈 存在 着 一 个 极限 值 ， 
称 为 事件 4 的 概率 ， 记 为 PA), 


lim (Ni/N)=P(A) 
Nooo 
若 事件 4 和 事件 B 是 两 个 不 同 的 随机 事 忻 ，, AM BRAS 
(A+ B) 是 指 和 A 与 B 中 至 少 有 -- 个 发 生 的 事件 . 如 用 两 个 圆 分 别 表 
示 事 件 4 和 事件 B 的 集合 、 如 图 11-1 所 示 ， 则 两 个 圆 的 总 和 就 代 
表 4 十 B 的 集合 。 显 然 ， 只 有 4 发 生 , 或 者 只 有 B 发 生 , REA 
BAN RENE RAB (A+B), 
定义 事件 4 与 事件 BB 的 积 事件 48 为 4 和 B 同 时 发 生 的 事 
Tr, 图 11-2 中 两 个 事件 重 至 的 区 域 就 是 积 事件 的 区 域 。 
(二) 和 事件 概率 公式 
和 事件 A+B 的 概率 就 是 图 11-1 的 区 域 中 事件 集合 的 概率 ， 其 概率 公式 为 


图 11-1 事件 的 和 
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Р‹А+В)=Р(А)--Р‹В›—РС(АВ) 
如 果 AG B АЕ А ee BU 
P(AB)—0 
则 称 事件 4 与 事件 BRERA (ARE 11-3) 


图 11-2 事件 的 积 图 11-3 互 斥 事 件 
(=) 积 事件 概率 公式 和 条 人 忻 概 率 
设 驯 为 任意 事件 ，PCB) 之 0, 则 在 B 发 生 的 条 件 下 ,事件 4 的 条 件 概 率 定义 为 


PCAB) 


PAID= реду 


(11-1) 


即 
PAB) - POD PAB) 
同 理 有 
POB)- P(A) PB! А) (11-2) 
ER 012) 即 称 为 积 事件 的 概率 公式 。 
对 于 事件 4 和 事件 B, WHA 事件 的 概率 不 受 BERR EM, HR 


PCA|B)=PCA) (11-3) 
MRR А RETF 显然 ， 对 于 相互 独立 的 事件 4 和 召 ， 积 事件 概率 公式 为 
P(AB)=PCADP(B) (11-4) 


《四 ) 全 概率 公式 
符号 AJ) 表示 某 一 事件 组 14 ,4:，…}。 如 果 任意 一 次 试验 的 结 梨 都 至 少 发 生 {4 } 中 的 一 
个 事件 ,; 则 称 {4} 是 一 个 事件 的 完备 集 。 显然， 对 于 事件 的 完备 集 {41}， 有 
PCE A)=1 (11-5) 
RP, У 表示 对 (A) 中 的 所 有 事件 求 和 。 
如 果 A) 是 一 个 互 斥 事件 的 完备 集 ， 式 (11-5) 可 直接 写成 


PCX А)= E P(A)=1 (11-6) 
ПЕ BAL B A TIERRA 
PQD- E P(BA)= > PG|AOPCA) (11-7) 


XX EB CLA E- TE EE В Š ВАСА ЕМ ИЙ Fd ЖЕ. 所 以 , Ж 
件 召 可 以 表示 成 式 〈11-7》 所 示 的 互 斥 积 事 件 之 和 。 
B=BA BA: += = 5) (ВА) (11-8) 


Ch) RHE AX 
事件 A 对 于 事件 B 的 条 件 概率 , 可 以 由 事件 4 和 事件 B BOBESEDUS BOT A 的 条 件 概 
率 算出 ， 这 就 是 关于 条 件 概率 的 贝 叶 斯 (Bayes) 定理 : 
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PBAPP) 
PB) ` 
Ж AA ТЇ (A) 是 一 个 三 斥 事件 的 完备 集 ， 利 用 全 概率 公式 01-8), 公式 (11- 

9) 又 可 写成 


Р(А|В) = alo 


PGLAYPCA) — P(BIA) PCA) 
PB) ^ NUPGO APAD] 


P(AIB)= 


二 、 酶 机 变量 及 其 分 布 


(一 ) 随机 变量 
对 于 任 一 随机 实验 ， 它 的 样本 空间 是 5={e} .如 果 对 于 每 -- 个 属于 该 样本 空间 的 样本 有 
一 个 实数 Xe) 与 之 相对 应 BORER BP E XL E AS IX Co) LUI X Ce) ARH BAL 
变量 。 
有 些 柄 机 变量 ， 它 全 部 可 能 取 到 的 值 是 有 限 个 或 是 9f 列 无 限 多 个 ， 这 种 随机 变量 称 为 离 
散 型 随机 变量 ， 否 则 称 为 连续 型 醇 机 变量 。 
É 式 是 一 个 随机 变量 ，z дЗ, РО) РХ, Хн 
PiX 所 x} 表示 柄 机 变量 XX 取 值 小 于 z 的 概率 。 对 于 任意 实数 r. z (rus r.) A 
Pins Sa) = PAX Sa} PS Е) ЕС) (11-10) 
因此 , BX B 18 BOR RE E X AEE KE (a. =) ЕЙ Ж, А Eoi. 
FPA RFE ME XE T RL EE ИИ ЖЕЕ. 
分 布 函 数 具 有 以 下 的 基本 人 性质 : 
OF @ 是 一 个 不 减 函 数 。 事 实 上 ， 
Fla) F(a.) = Pi XO Gras 
@ OSF GO «1 这 是 因为 概率 的 最 大 取 值 为 1 。 
一 般 ， 如 果 对 于 随机 变量 X 的 分 布 函数 F(z) ,存在 非 负 的 函数 A(z) ,使 对 于 任意 实数 
有 
F(z)= [fo (11-11) 
则 对称 为 连续 型 随机 变量 , Hh BU а) X HARRERAK, PR. 很 明显 ， 
连续 型 随机 变量 的 分 布 函数 是 连续 函数 。 由 定义 知道 概率 密度 县 有 以 下 性 质 ， 
Ф Ar)30 
® ES 
© PX) 0) FG | feodis 
O 若 在 "点 处 连续 , 则 有 аР) Vde= f Go) 
(=) 几 种 最 重要 的 连续 型 酶 机 变量 的 分 布 
1. 均匀 分 布 
设 连 续 型 随机 变量 X 在 有 限 区 间 (а, 00 ARE. ， 昌 其 概率 密 虚 为 


1/(é—a) ахь 
f= / а) ar 


0 其 他 
MP X ZEIT (а, 6) 上 服从 均匀 分 布 。 
在 区 间 (a, b) 上 服从 均匀 分 布 的 随机 变量 ， 有 共有 下 述 意义 的 等 可 能 性 ， 即 它 落 在 区 间 
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(a, 5) 中 任意 长 度 的 子 区 间 内 的 可 能 性 是 相同 的 ， 或 者 说 它 落 在 子 区 间 内 的 概率 只 依赖 于 于 
区 同 的 长 度 而 与 子 区 疝 的 位 置 无 关 。 事 实 上 ， 对 于 任意 长 度 为 关 的 子 低 问 
(Goch) aee hb. 
A Pe<x< +в} - | fade [уфа месо 
均匀 分 布 在 计算 机 数值 模拟 中 具有 相当 重要 的 地 位 。 


2. 正 态 分 布 
设 连续 型 随机 变量 X 的 概率 密度 为 
FO re (11-12) 
stib qe oz 0 为 常数 , 则 称 X 服从 参数 为 fea) 
joo 的 正 态 分 布 或 高 斯 分 布 , 记 为 号 ~ N L6 
Go), T pR o DIRA ES A I 
学 期 望 和 均 方 差 ,四 两 个 非常 重要 的 参量 。 HE 
它 的 图 形 示 于 图 11-4。 特别 是 当 a=0, = і 
ТХ АЕ ЯЗЫ, RE 
f(z) 的 图 形 对 称 于 x— =, o 的 大 小 影 YN -一 --r=0.35 
响 图 形 的 形状 , o RUIEERERE s o 小 则 图 [\ шшш 
ERN. Bap 
一 般 正 态 分 布 可 以 通过 适当 变换 化 成 141 
标准 正 态 分 布 。 AN 
EOXeNGSSSZ-OC-OASUE 77700 07 Тр 


т 


服从 标准 正 态 分 布 , 即 Z— N (0,12), 


图 11-4 不 同 = 的 正太 分 布 图 
3. йй 
设 连 续 型 随机 变量 X 的 概率 密度 为 
Ton ла (iUe r 
f@= 41/68/2202") 1} е a0 
о х0 


式 中 ,TC(，) 为 合 玛 函数 , п Е, 则 称 X RA EL E HO n RU x! Б, 180 XY 00. М 
不 同 的 自由 度 w，f(z) 的 图 形 示 于 图 11-5. X? 分 布 是 一 个 十 分 重要 的 分 布 ， 这 是 因为 存在 有 
0.5 如 下 一 个 定理 : 


落日 ,所 ， 护 是 相互 独立 并 且 都 服从 正 态 分 

Zos 布 N(0,1) 的 随机 变量 ， 则 随机 变量 
š VHE+G +e +e (11-13) 

92 服从 自由 度 为 n Y ZY s 
01 Has BY, x? xm DA. n= 2 时 ， 
o X O4 fa b ЖН Hon 
£ Оой ж p bk pm Жуй). 
六 (mz), 且 相互 独立 , 则 

图 11-5 不 同 自 由 度 GO É y: 2 El XT Y itm) 110 


CPRRARMR WAER OLL RAA d) 009 EAE 


442 


Р >йо)= | Раса aras 


则 称 此 点 为 “分 位 点 。 对 于 不 同 的 aun a GO AY 388 P de RC e Mos 浪人 xm) 分布 表 ,可 在 任 - 
本 统计 学 书 上 .方便 查 到 。 


4. tA 
OD 定义 上 + 分布 的 概率 密度 盟 数 定义 为 
SO = PLGA /20/[0Gr/2) Mae} 40а) 777 (Soo) (11-16) 


ADC + AS BRE, я 为 正 整 数 ， 是 > 自由 度 参数 。 式 (11-16) 表示 随机 变量 服从 自由 
度 为 nn 的 :分 布 , WAT). 注意 到 由 于 /GD 一方 一)， 所 以 它 的 图 形 关于 纵 轴 对 称 ,， 当 
1 增 大 时 ， 它 将 近似 于 正 态 分 布 ， 如 图 11-6 所 示 。 
定理 : 若 随机 变量 X 和 了 相互 独立 , H XX 服从 正 态 分 布 N (0. D. Y 服从 自由 度 为 n 的 
x 4r. д) 
T iF (12-17) 
Nn 
服从 自由 度 为 = 的 上 分 布 。 
(2) en) BRR IAEN <(0<“ 
三 ,车 有 一 点 tt) 满足 条 件 


РИ | Кода 


JURE JC у са ЕЙ x 分 位 点 。 由 于 (0) 
形 的 对 称 性 .有 
fn) =t) 
” 对 于 不 同 的 a,n,t.(m) 的 数值 已 制 成 数 表 , 称 为 : 
mils 不 同 自由 度 的 + 分 布 图 《mn) 分 布 表 , 可 在 任 一 本 统计 学 书 上 方便 查 到 。 表 
中 所 列 最 大 为 45, 当 nn 之 45 时 ,就 用 NN(0,1") 分 布 来 近似 替代 。 


5 ЕЗИ 
《1) 定义 ”车 随机 变量 7 和 相互 独立 , 且 分 别 服从 自由 度 为 wm ЯП о P TN 
变量 
F= (рт) (л) 


的 分 布 密度 函数 为 
fal e BD она з r0 (11-18a) 
lo zs0 (11-18%) 
AH, BC+. + AW (Beta) ЖЖ, HEL. Hp. а HER, BH 
Во) | 21a) s aris) 
RAW (Beta) 函数 。 随 机 变量 下 称 为 服从 自由 度 Gn, n) AF Ab, fino F— FO, 
a) ,注意 ,下 分 布 有 两 个 自由 度 , 第 一 个 自由 度 澡 是 组 成 下 分 布 的 分 子 随 机 变量 的 自由 度 , 第 


二 个 自由 度 % 是 组 成 记分 布 的 分 母 随机 变量 的 自由 上 度 ， 密度 函数 f(x) 的 图 形 示 于 图 11-7。 
(2) FAC EUER 
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D X-Fi Mies Fem). 
1 
© Е, Oord T DEG] 
(OD 五 分 布 表 及 其 用 法 ”对 给 定 的 <(0<a< D 
1), 若 有 一 点 F.(n,m)88 Р ЖЇР 


FAFSSF от) | fer =a 


则 称 此 点 为 f(x,m) 分 布 的 上 a 分 位 点 。 对 于 不 同 
的 anm En mm Е Е IRAR, A F. 
т). 可 在 任 一 本 统计 学 书 上 方便 查 到 。 注意 
到 Ftn,m) 分 布 表 中 所 给 的 a 都 是 很 小 的 数 ， 如 
0.10, 0.05, 0.01 等 等 ， 当 4 较 大 时 ， 如 a=0.95， 表 中 查 不 到 ,这 时 根据 前 述 下 分 布 的 件 
ЖО, ЖАЯ]. ШЕ, 2015,12) —1/[Fo(02,18) ]=1/2. 48—0. 403, 


图 11-7 不 同 自由 度 的 下 分 布 图 


三 、 随 机 变量 的 数值 特征 


(—) 数学 期 里 
没 离散 型 随机 变量 X WEY Р{Х= л) = pe Gc12 50 BUR Non, 绝对 收敛 ， 
则 称 级 数 End 58 X ARRAY EOO J 
ЕСХ)= Улар 
对 于 连续 型 随机 变量 ， 若 它 的 概率 密度 为 fO) ,注意 到 f(x)dz 的 作用 与 离散 型 随机 变 
量 中 的 p 相 类 似 ， 于 是 自然 有 以 下 的 定义 : 


设 连 续 型 随机 变量 X 的 概率 密度 为 Pe). BARD [rode 绝对 收敛 , 则 称 积分 [reos 
WX RAE EO) 8р 


E(X)= рея (11-20) 


数学 期 望 简称 期 望 或 称 为 均值 。 数 学 期 望 具有 以 下 性 质 : 
中 设 c 是 常数 , 则 有 EC)=c, 
QUXR-TPHMEE.c 是 常数 , 则 有 EX) =cE(X) 
O b XY 是 任意 两 个 随机 变量 , 则 有 EX +Y) =E(X)+EY) 
@ V Х,У 是 两 个 相互 独立 的 随机 变量 , 则 有 ECXYO) = ECX)ECY) 
(=) 方差 
设 X 是 一 个 随机 变量 , 若 (LX 一 E(X) 下 } 存 在 , 则 称 EMIX — ECX) TX 的 方差 , 记 为 
Var( X) 8k DOD Вр 
Var(X)=D(X)=E({X-E(X)}'} CH-21) 
在 应 用 上 还 引入 与 随机 变量 具有 相同 量 岗 的 量 /Var CD , 记 为 oCX), 称 为 标准 差 或 均 
方差 。 
对 于 离散 型 随机 变量 , 按 上 述 定义 , 则 有 
Var(X)=D(X)= X[z—E(X)Ep, (11-22) 
Hep P(X=2z,}=pp (1,2,5), 
对 于 连续 型 随机 变量 , 则 有 
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Var(X)= D(X)= fix - EOD EFC dr (11-23) 
Ah f GO X ORB FGo. SER Ht 
Var(X) = DOO SEX- ЕХ): (11-24) 


根据 前 述 数学 期 望 的 性 质 ,容易 证 得 
Var(X) DOO =E [X -EX 
-ElX! 2ХЕ(Х›+[Е(Х›У]} 
=E(X*)—E 2X E(X) + E{ LEX) F} 
—EQC) -2EODEOO--LEOO F 
=ECX")— [E(X) Ë 
同样 利用 数学 期 望 的 性 质 ,容易 证 明 方差 的 以 下 性 质 ， 
(D 设 < 是 常数 , 则 有 Var(c)=0, 
Qi X 是 一 个 随机 变量 ,c 是 常数 , 则 有 Var(cX)= Var(X) 
图 设 X 了 是 两 个 相互 独立 的 随机 变量 , 则 有 Var(X+Y)= Var(X)+Var(¥) 


第 二 节 应 用 数学 基础 知识 


一 、 矢量 及 其 运算 


1. 列 矢量 与 行 矢 量 
当 说 到 一 个 矢量 a 时 ,一 般 是 指 列 矢量 TRE 是 指 它 的 转 置 ,数学 表达 式 如 下 ， 


a 


a= а= Га аа] 


两 个 拓 量 说 成 相等 , 当 且 仅 当 它们 的 每 一 个 元 素 都 对 应 相等 。 即 如 果 


а fb 
a= ^ b= ñ 
а, ь,) 
RAS a =6.G=1,2,,n) Rta Alb THE. 
2. 矢量 加 减法 
两 个 或 卫 个 以 上 的 矢量 相 加 (或 相 减 ), 是 指 它们 的 对 应 元 素 相 加 (或 相 减 ), 即 
а + Б, 
a + b, 
a+b= ñ . 
4 + b 
ABER ERU AFER: 


actb—bta (ZH) 
+ сев bte) (HAR) 
at0=a 
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称 为 零 矢量 , 它 的 每 一 个 元 素 都 等 于 0。 
对 于 任 一 矢量 a, 都 存在 ~- 个 与 之 相反 的 矢量 一 a, 它 们 的 和 等 于 零 矢量 , 即 


а-=(—а)=0 


3. RA BR 
ШЖ “是 一 个 实数 《或 称 标量 )， 则 它 与 任 一 矢量 a 的 乘积 为 该 矢量 的 每 一 元 素 与 它 的 乘 


积 ， 即 


hey 
‘hay 
ka= | 
s.) 
RU GRECE EAT TERR : 
b Choa) = (hike a ква) 
h (a+b)=kba+hb (分 配 律 ) 
(hy +k a=hathe (分 配 律 ) 
对 于 任 一 矢量 q 有 
0a=0; la=a; —la=—a 
4. ХЕШ RRR) 和 外 积 
两 个 矢量 的 内 积 产 生 一 个 数 ， 即 
rb, 
b, 
а= Га, ao al +), — Lab, 
Н 
很 明显 ， 
a (b+e) =a'b+a'c {分 配 律 ) 


(a+bye=a'et+ bc 《分 配 律 ) 
如 果 两 矢量 的 点 积 为 零 ， 则 称 它们 相互 正 交 ， 即 a'b 一 0。 
两 个 矢量 的 外 积 产 生 一 个 矩阵 ， 即 


a “ab, ab се ab, 
ай= ñ [b bone] d а aby (11-25) 
a ab m Uc b, 
这 样 的 矩阵 可 称 为 双 线 性 矩阵 ,在 多 元 分 辨 中 有 着 特殊 的 地 位 。 
二 、 上 矩阵 及 其 运算 


nXm TERHERE: 
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ай аш U dim 
da n fU йы 
Ld. do '* йы 


PRY n AT m PERE, RER пот 阶 矩 阵 。 元 素 4 可 以 是 数 ， 也 可 以 是 代数 式 。 当 n= 二 1 时. Ж 
这 矩阵 为 m TRE: 当 m= 二 1 时 ， 称 这 矩阵 为 n 维 列 矢量 ; n—m 时 ， 称 为 方 阵 。 

通常 用 大 写 黑体 字母 4, В, RRE, 用 带 有 下 标 ;i，j 的 小 写字 母 ap б, ИЖ 
TER A, В, BATH j 列 的 元 素 ， 因 此 ， 有 了 时 也 用 (a.,) dm SEE A, RA 有 时 也 
可 以 用 列 矢 基 来 表示 ， 即 ，4 一 [ea а). 

1， 和 拖 阵 的 加 减法 

两 个 或 两 个 以 上 的 具有 相同 阶 数 的 矩阵 相 加 (或 相 减 )， 是 指 它们 的 对 应 元 素 相 加 《或 相 
减 )， 即 


A— B= (a, + OG.) = lamb) 
矩阵 的 加 减法 县 有 以 下 性 质 : 

A+B=B+A (交换 律 ) 

(4 十 B) 十 C= 和 十 (B 一 C) (结合 律 ) 

2， 和 矩阵 的 数 乘 

如 果皮 是 一 个 实数 〈 或 称 标量 ), IE 5315 ARAMA. 该 矩阵 的 每 一 元 

Жн A 中 相应 的 元 素 与 上 的 乘积 所 构成 ， 即 ， RA—E (а) = (ia)。 容 易 证 明 ， 矩 阵 的 数 乘 

RAW FER: 

k OSA) = (hk) A CBSE) 

k (A—B) EAT EB (分 配 律 》 

Gi EOA— AF EA (分 配 律 ? 


3. $5 ER 
(пх BY EE AS Ca), 5 (qx m) BE  В= Ch, orm ff BREE T e OX m) BREE c — 


Co nxn ERIK c, 由 等 式 


c = Leah, 
决定 , 即 为 A 的 第 i 行 与 B 6958 j 列 的 点 积 。 注 意 到 矩阵 乘 矩阵 时 一 般 不 满足 交换 律 , 即 
ABBA 
但 是 满足 结合 律 : 
ABC— (AB)C= A(BC) 
同样 也 满足 分 配 律 ， 


A(B8+C)=AB+AC 
(A+B)XC+D)=A(C+D) +B(C—D) 
4. 零 第 阵 和 单位 矩阵 
ЖЕН 0 表示 , 它 的 全 部 元 素 都 为 0 一 个 nn 阶 方 阵 , 假如 其 对 角 线 上 的 元 素 都 是 1, dE 
对 角 线 上 的 元 素 都 是 0， 就 称 为 单位 矩阵 。 它 可 用 了 或 也 表示 , 很 明显 , OMT 有 下 列 两 个 类 
似 于 数 0 和 数 1 所 具有 的 性 质 : 


A+0=A (11-26a) 
TA=AI=A (11-26b) 


5. ЖЕНЕШЕ 
ЖЕРЕН А ITAI 8.181838 fu ek» 所 得 的 矩阵 A PE eB A 的 第 
i 行 第 7 列 的 元 素 用 wy 表示，4 的 第 ; 行 第 了 列 的 元 素 用 4, 表示 ， 则 有 关系 式 


a =a, (11-27) 
由 以 上 式 (11-27) 定义 ,可 得 到 如 下 的 关系 式 ; 
(AB) = B'A' (11-28а) 
(ABO) -CB'A (11-28b) 
如 时 矩阵 АВОН ВЕРЕЯ THE HE, MASA. MERCED, 


6. ЖН 
WRT ACRI B. ÑE AB— I. A B Je A 的 道 阵 并 记 为 4- ， 如 果 А Е, 
则 称 A 是 非 奇异 怎 阵 ， 或 称 为 满 铁 乍 阵 ， 否 则 称 是 奇异 矩阵 。 目 阵 的 道 这 算 具 有 以 下 性 质 : 
(AB)-'=B-'A- (11-29) 
(A0 t= (471) (11-30) 
7. 矩阵 的 行列 式 
方 阵 的 行列 式 是 一 个 数 ， 记 为 det(4) =e, a 为 任 一 实数 。 如 果 为 一 ВОГ, 有 
det(A)= È (— 1) adet(Ah,) 
其 中 AEn DX (tn 一 1) 阶 矩阵 , 它 是 划 去 的 第 行 和 第 у 列 所 得 到 的 A 的 子 阵 。 有 用 的 行 
列 式 性 质 包括 


det(AB)=det(A)det (B) 

det (A) =det(A) 

det(kA) 一 Kdet(A) А BG Kn EE 
det(A)s60. © 4 是 非 奇 异 矩 阵 


8. EZEK 
如 果 一 个 方 阵 4， 满足 AA=1, ЖАЛ A 为 正 交 和 矩阵， 显然 有 
А'=А^! 
det(4) 一 士 1 
这 是 因为 
detCA)det (A) —det (A')det (A) —det (AA) ^ det D) —1 
9， 方 阵 的 迹 
一 个 方 阵 A АО (D ,定义 为 它 的 主 对 角 线 上 元 素 的 和 , 即 
tr(A) — Xa, (11-31) 
特别 是 当 A 是 个 一 行 一 列 的 矩阵 , 即 为 一 个 数 & 时 ,有 
trla)=a 


这 一 性 质 在 一 些 证 明 中 经 常用 到 ,例如 二 次 型 y'Ay 是 一 个 数 ,所 以 


tr(y'Ay) = y'Ay (1-32) 

方 阵 的 迹 具有 -一 些 性 质 : 
tr(A+B)=tr(A) +tr(B) (11-33a) 
tr(@A) =atr(A) (11-33b) 


tr(AB) = (ВА) (11-33c) 
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Elir(A) ]=ur[ F(A) ] (11-33d) 
在 此 , E [u] RATE 4 的 迹 求 数学 期 乌 (或 称 均值 )， 式 “11-33d) 所 示 的 性 质 
表示 求 迹 运 算 与 求 数学 期 望 的 运算 可 交换 。 数 学 期 望 的 定义 已 在 统计 学 基础 知识 中 介绍 。 
10. ЖЖЖ 
— nxm HE A, 其 秩 是 4 中 最 大 线性 无 关 行 数 ( 或 列 数 ), 记 为 rank (A). EA 
有 下 述 性 质 


C<rank(A)<min (n,m) (11-342) 
rank AB) min [rank (A) rank (8) ] (11-34b) 
rank (A+ B) rank (A) —rank(B> (11-340) 
rank (A'A) -rank(C AA) =rank (A) (1-340) 
mR A Jë n ELIO Fe Д FLDU detC4) 不 等 于 零 时 ， 
rank (A) —n 


11. ERER EGE ОЕ 
一 个 矩阵 A, MRA 
АУ АУ A = AX, (11-35) 
则 称 满足 上 述 方程 的 矢量 YG— 1,2 ,为 矩阵 4 ATT T REE А Gm 1,2, 740 BO APE 
ХЕ, MRE A 为 对 称 和 矩阵 , 则 所 有 特征 值 都 是 实数 。 
如 果 存 在 一 非 奇异 矩阵 T В= ГАГ | AE BALA RRR. MR RE 
ZEE RE , ИЖ: B E: 4 的 正 交 相似 变换 矩阵 。 
对 于 任 一 对 称 矩 阵 4, 可 经 正 交 对 称 相似 变换 成 为 一 对 角 乱 阵 A, BB 
ГАГ=Л 或 4 一 FA 
可 以 证 明 , 其 中 的 对 角 元 素 AGH 1,2, JO ЗЕК: 4 的 特征 值 ,而 组 成 正 交 和 矩阵 丁 的 
SYR y,G= 1,2 n ,如 则 是 其 相对 应 的 特征 矢量 .而 县 ,年 阵 4 BJ RE SE F xf ME BE A 中 对 
角 元 素 不 为 零 的 特征 值 的 个 数 。 
12. 广义 特征 值 问题 
这 里 所 说 的 广义 特征 值 问题 ， 是 指 线性 广义 特征 值 问题 
AY = АВУ (11-36) 
其 中 ,4,8 X nXm ЗНУ Эр n ESA Xi А у. H ОВУ ВА (11-36)23 jË ЫЈ 
题 称 为 广义 特征 值 问题 ,并 称 满足 方程 (11-36) 的 矢 基 Y ЖЕ: 4 相对 于 B 的 广义 特征 矢量 ， 
AFH ER. 4AM BROAN. RA QZ 算法 求解 ,有关 其 具体 解法 可 参阅 文献 二 。 
13. FRR 


一 个 方 阵 4, 如 果 消 足 A= AA AS RU ЕРЕ. 例如 | 。 “| RUE HEAR IE. ЖЕЕ 
具有 下 述 性 质 ; 


© 室 等 阵 的 特征 值 非 09 即 1。 
证 明 аА НЫЯ 
Ab=cb (11-37) 
式 中 沁 是 非 零 矢 量 , 它 是 4 的 属于 特征 值 a RUTRAE AO AMAR A 
A'b=aAb=a'b (11-38) 


同时 ,4 ESE RE , Вр 


449 


Ab=_ab=: A’b=aAb=a'b> аа (11-39) 
方程 式 (11-39) ,立即 可 得 a= 1 X а= 0. 
D BAM 4 对 称 且 寡 等 , 则 该 失 阵 的 秩 [rank(4)] 等 于 该 矩阵 的 挝 。 
TENA ROSE ESE 4 的 秩 为 ~, 由 于 A 是 对 称 答 阵 : 故 在 在 正 交 年 阵 ,使 得 
А . 
b | 
А=0 EA O = QAQ (11 40) 


Н ААА Æ A REA A X E Ek r MRE. EAE 0 Вр 1 BT А, 
ААВ DLR пг 个 全 为 零 , 于 是 
tr(A)=tr(QAQ')=tr(AQ'Q)—tr(A)— XA — r—rank(A) 
14. J” X E BE: 
хн BRE A, EGER m Xn BERB, WEFR (11-41)， 
ABA=A (11-41) 
ДВА ГНЕ, 通常 记 为 4 ， 也 称 “ 一 ” 逆 。 若 4 是 一 个 满 秩 矩 阵 ， 由 式 〈11- 
AD 可 看 出 ，4- 就 是 4-'。 因 此 广义 逆 确 是 通常 着 矩阵 的 一 各 推广。 ТЕЙИ. 对 任何 矩阵 , 广 
义 道 是 否 一 定 存在 ? 什么 时 候 是 唯一 的 ? 如果 在 式 (11-41) 的 基础 上 再 增加 一 些 条 件 ， 使 得 
所 定义 的 广义 道 存在 并 且 唯 一 ,这样 的 广义 逆 称 “十 ” 闻 或 称 Moore-Penrose Й, WA A , € 
要 求 满足 4 个 条 件 : 
@ 44-4 一 4; 
@ A* AA! =A; 
@ (AS = AAT; 
@ (A*AD'—-A* A; 
KMHOMEHORMRAE: RAOMREOMRA MME. 容易 证 明 ，Moore-Penrose 逆 是 存 
在 且 唯 一 的 。Moore-Penrose 逆 或 称 “ 十 ” 逆 具 有 如 下 性 质 ; 
rank (A) —rank(A* ) 
(A+) =A 
(ADT = (AT 
(CAB) Y — (ABO? 
A4" 和 AT A BBB Xt RE S BE, 
15. REREAD SK 
ARE ARER: MSR MER. JH dA/de 表示 ， 该 导数 矩阵 的 元 素 是 矩阵 A 中 相 
应 元 素 对 变量 RIHAR Pa AAi TA j 列 元 素 , 则 d4ydt HR i 行 第 7 列 的 元 素 为 da/ 
di, 
矩阵 的 导数 有 如 下 性 质 ; 
d(AB) /di = (dA/d)B+ (dB/di}A 
d[rr (A) ]/de=tr(dA/de) 
16. ха 
设 了 是 关于 矢量 * 的 数量 函数 ，/ 一 .Arx)， 则 f 关于 矢量 x 的 导数 定义 为 
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df (x)/dx—[df/dx, df /dx, аак, + sd f /dx, T 
式 中 ,一 [ma 加。 矢量 的 导数 有 如 下 性 质 : 
Ф # a 为 常数 矢量 , 则 
d(a'x)/dy—a 
dG'a) /dx—a 


@ d Ga Ax) /dx -2Ax. XB. AMAT. BARNS TR MEHR, 
三 、 独 立 性 、 正 交 性 和 子 空间 


在 = 维 实数 空间 中 ， 如 果 
XàÀa-0 © A= A=. L 0 

MARR Baa BREEN, BM AE Aa a KEARE 
DAG =0 зї. UPR (а, assa E ER MERE IR. 

在 维 实数 空间 的 子 空间 是 一 个 子 集 ,这 个 子 集 也 是 -个 矢量 空间 。 矢量 组 {a EM 
的 所 有 线性 组 人 台 构 成 一 个 集合 ,被 称 为 矢量 组 la a... ,a,} 张 成 的 子 空间 , 记 为 

span (а, d, sab 4 D Aa |A; Aen A € R) 

如 果 矢 量 组 (a,a,… ,a,} 是 线性 无 关 的 ,并 且 b€ span (а, .а,, 7n a.) ,那么 .5 是 矢量 组 
tm) 的 一 个 唯一 的 线性 组 合 。 

如 果 5,3. S, 是 实数 空间 的 子 空 间 , 那 么 它们 的 和 也 是 一 个 子 空 间 。 子 空间 的 交集 也 
是 一 个 子 空间 。 

dn R (a, a，-…,a} 是 线性 无 关 的 ,并且 不 是 i аза, HE 96 FE + 
和 集 , 这 个 子 集 {a oaa HERE a, ;a,} 的 一 个 最 大 线 件 无 关子 集 , 那 么 

span {a ,a, ss ) =span {ay a) à.) 
JF B. (a, ra, orsa Е span {asas ,qn} 的 一 组 基 矢 量 。 如 果 5 Ж л HEC — 25 
间 , 那 么 在 S 中 存在 无 关 的 基 矢 量 {a зао) ,使 得 
S=span{a 4.7 au) 

一 个 子 空间 5 的 任 一 组 基 矢 量 的 个 数 必然 相同 。 这 个 数 就 是 该 子 空 间 的 维 数 , 记 为 dim(59) . 

ERS PATHE 4 一 [e: ,wz,…，*e] 有 关 的 重要 的 子 空间 。4 的 值 域 子 空间 定 
X 


RGD—(y- X Xa HÀ AER) =span la d), ay} 
A 的 零 子 空间 定义 为 
N(A)= {0= X pa | pas tet pm € R) 
^B EY RE XO 
rank(A)==dim[R(A) J 

可 以 证 明 rank (A) — rank AO РЕ 4 8E PE BO c BEST ICRCK XXX S Rx 
WR. 
对 于 任 一 矩阵 ALL. (аот), WJ 

ат №) ]--dim[ RCA)]=n 
МЖ 4 为 一 方 阵 ,那么 下 面 的 说 法 都 是 等 价 的 : 
(D A 是 非 奇异 的 
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9) dim_NCA)]=0 

@ rank (A) =n 

# п TH {НН d SEA 8 (a asina TE iZ. BER ага,=0, DU ER IC R EA E IE. 
交 的 ,如 果 满足 ам, 70,09, 70,24 626758, —1, 6 г= у, ШШ ЖЕ R e ER ELE GE]. BR 
Ж. п PABBA rh AM AE SES, ..S,.. 5, ЖУАН Н.Е Ж. ERE LE X € S NL y € S, ЖН 
i RET 


x'y=0 
一 个 n 维 子 空间 5 的 正 交 补 定义 为 
St= (yen HS x'y-0.x€ S; 

如 果 矢 量 组 (s .a;，…,et} 是 标准 正 交 的 并 张 成 了 维 子 空间 S ШЖК sy ot sau 
成 子 空 间 的 一 个 标准 正 交 基 。 它 总 可 以 扩充 为 上” 维 空间 的 一 组 完全 的 标准 正 交 基 :al .qs，…， 
da). ШЕ 


S =spaniag..s a! 
四 、 矢 量 范 数 和 和 矩阵 范 数 


在 化 学 计量 学 的 算法 中 ， 经 常 要 求 我 们 评价 矢量 或 矩阵 的 大 小 ， 对 此 矢量 范 数 和 矩阵 范 
数 是 非常 有 用 的 。 


1， 矢 量 范 数 
在 4# 维 实数 空间 的 矢量 x 的 范 数 是 一 个 这 样 的 函数 jx) , 它 具 有 下 列 性 质 : 
fGD2:0 PATA п Е СОЗ BLA BE x, 等 号 当 且 仅 当 x 一 0 时 成 立 ; 


fx 十 站 和 fx) 十 f(y), 对 所 有 的 4 维 实 数 空间 矢量 x 和 了 成 立 
fGx)- |а|) 对 所 有 的 维 实数 空间 矢量 x 成 立 。 

我 们 用 |x | 表示 该 函数 f(x) ,在 双 坚 线 下 加 下 标 来 区 别 不 同 的 范 数 ， 
一 种 有 用 的 范 数 是 Holder 范 数 或 称 p 范 数 ,其 定义 为 


Вх d p= Cas |+ s Pee + |x, | yU (11-42) 
式 中 
be bim Cn ER ds n xD 1- 范 数 
lx | = Con [P oe Rh |x,12) 2 2- 范 数 
l| x | „=тах‹|х;|) 极 大 范 数 
这 3 个 范 数 是 最 重要 的 范 数 。 关 子 2- 范 数 的 一 个 古典 结论 是 Holder 不 等 式 
lxyl lx bul yl; l/p+1/g=1 


它 的 一 个 非常 重要 的 特殊 情况 是 Cauchy-Schwatz PER: 

НЕЗНАЕ 

其 中 ,在 正 交 变 换 下 2- 范 数 是 不 变 的 ,因为 如 果 = Ml 
[Ох 1 2 一 riOIOz 一 rz 一 |x 


2. Ей 

矩阵 范 数 的 定义 与 矢量 范 数 的 定义 应 当 是 等 价 的 ,在 实数 空间 的 矩阵 4 的 范 数 A(4) 也 
RA RUPEE: 

FANO 对 所 有 的 实数 空间 和 矩阵 А, EH i A=0 时 成 立 ; 
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f(A+B)<Sf(A)+f(B) SHAS Ee ALB Rr s 
FA) = |a | f(A) 对 所 有 的 实数 空间 矩阵 4 成立。 
用 41 表示 该 函数 f(4) ,与 矢量 范 数 一 样 ,矩阵 范 数 也 用 加 双 竖 线 来 去 示 。 
在 数值 分 析 中 ,最 常用 的 范 数 是 Frobenius 范 数 或 称 产 范 数 ,其 定义 为 
lAl = С 14,19 (11-43) 
Al p ERK 
|All ,=sup(} Ax |; [lx |.) (11 44) 
在 本 定义 中 用 的 p 范 数 就 是 矢 曼 范 数 已 定义 过 的 p 范 数 ,在 此 定义 的 矩阵 的 p 范 数 也 是 
KER. REPE p 范 数 具有 下 述 性 质 ; 
WABI, <All, Bll, 
I Ax lm A), daly 
特别 地 ,矩阵 的 Frobenius 范 数 和 2 SEM OE FF p RIAD ТЕПЕ SEAE PAR EA А] ИТД 
的 维 数 合适 的 正 交 和 矩阵 APA 
QAP ||2= | AI: 
I QAP || -= | All 


m * Ш 
Б МИЛ ЖЕЙ SR — ВЕ, Bl 
а fab, af c абы 
FL вок] |b: abs 5 аб 
a m m Ut m 


然而 ,对 于 三 个 矢量 的 外 积 , 用 上 述 方法 就 很 难 表 出 了。 为 此 ,定义 ое H a bic 这 三 
个 矢量 的 外 积 , 它 的 结果 将 产生 一 个 形 如 立体 的 数据 ,在 此 记 为 6G、 即 
б=а®&®с= (С) G—1.2, m j— 1,2, mi k= 1,2, sd) 
这 样 由 三 个 矢量 的 外 积 而 产生 的 张 量 ,一 般 称 为 三 线性 张 量 ,这 种 三 线性 张 量 在 多 元 分 辩 
中 有 着 特殊 重要 的 地 位 。 在 化 学 计量 学 中 ,一 般 都 是 把 这 样 的 三 维 张 量 展开 成 矩阵 来 计算 ， 
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第 二 篇 MATLAB 原 程 序 及 其 应 用 


第 十 二 章 A MATLAB 语言 进行 化 学 计量 学 
研究 编程 运算 简介 


化 学 计量 学 需 大 量 地 使 用 数学 、 统 计 学 和 计算 机 科学 知识 ， 编 制 计算 机 鹅 序 是 进行 化 学 
计量 学 研究 的 必要 基础 。 然 而， 用 经 典 高 级 诸 言 编制 程序 是 繁杂 的 ， 消 耗 大 量 人 力 旦 工作 进 
度 与 效率 不 高 。 随 着 计算 机 科学 的 飞速 发 展 ， 编 制程 序 的 方法 世 在 长 足 进 步 ， 由 美国 
Mathwork 公司 推出 的 MATLAB 是 一 种 功能 强 , 效 率 高 便 十 进行 科学 和 工程 计算 的 交互 式 软 
件 包 。 它 提供 了 一 种 爹 新 的 编程 语言 ， 其 语法 规则 简单 ， 很 贴近 数学 运算 思维 方式 。 用 
MATLAE 写 程序 , 犹如 在 一 张 演算 纸 上 排 列 公 式 和 求解 问题 , 编程 效率 很 高 , 轩 此 称 为 “ 演 
算 纸 式 的 ”科学 工程 的 算法 语言 。 

由 于 使 用 的 化 学 计量 学 程序 大 多 数 都 需 涉及 大 量 的 拖 阵 运算 ， 如 采用 一 般 高 级 语言 ， 如 
BASIC. FORTRAN, PASCAL 和 语言, 来 进行 第 阵 运 算 ， 不 但 党 要 很 多 子 程序 ， 府 有 生 有 
些 较 新 的 算法 ， 如 奇异 值 分 解 、 广 义 特征 值 问题 的 QZ 算法 、 人 工 神经 网 络 、 小 波 分 析 等 ， 还 
很 难 找到 这 些 高 级 语言 的 相应 的 子 程序 。 这 就 使 化 学 计量 学 研究 成 果 的 普及 受到 一 定 程 度 的 
限制 , 而 MATLAB 语言 则 正 是 在 矩阵 运算 的 方面 , 显得 特别 简捷 、 高 效 和 方便 。 在 化 学 计量 
学 的 研究 和 应 用 中 ,由 子 大 都 是 进行 多 变量 运算 ,矢量 和 怎 阵 是 基本 运算 单元 ， 所 以 ， 
MATLAB 语言 很 快 就 成 为 其 研究 的 主要 工具 ， 上 日前 国际 上 两 本 化 学 计量 学 专业 杂志 ， 
“Journal of Chemometris” 和 “Chemometrics and Intelligent Laboratory Systems” 多 次 对 其 进行 
了 专门 的 介绍 ， 使 其 几乎 成 为 进行 化 学 放量 学 研究 的 特定 计算 机 编程 语言 ， 很 多 化 学 计量 学 
的 新 算法 在 发 表 时 , 还 都 附 上 了 MATLAB 语言 所 编制 的 程序 . 要 想 企 我 国 普及 化 学 计量 学 、 
掌握 使 用 MATLAB 语言 似 很 有 必要 .MATLAD 语言 是 一 种 类 似 于 一 . 般 高 级 语言 编程 的 更 高 
级 语言 ， 它 不 但 保持 了 一 般 高 级 语言 特征 ， 还 特别 地 注意 到 了 人 机 交 眶 信息 的 优点 《从 这 一 
角度 来 看 . 它 与 BASIC 语 育 很 类 似 ), 可 将 一 个 复杂 编程 来 分 步 进 行 调试 , 特别 适合 进行 新 的 
算法 研究 . MA. КЖ MATLAB 版 本 的 不 断 更 新 , 其 功能 越 来 越 强 , 它 所 附带 的 一 些 工具 箱 
(Tool Вох), 使 之 在 诸如 一 般 数值 计算 , 多 元 统计 分 析 , 数字 信和 号 处 理 , 系统 识别 、 自动 控制 、 
时 序 分 析 与 建 模 、 优 化 设计 、 人 工 神经 网 络 、 动 态 仿 真 系统 、 小 波 分 析 、 特 殊 函 数 等 领域 . Ж 
现 出 一 般 计 算 机 高 级 语言 难以 比拟 的 优势 ,特别 值得 提出 的 是 , MATLAB 语言 还 直接 提供 了 
强 有 力 的 绘图 指令 ， 如 绘制 三 维 图 ， 等 高 线 图 等 ， 可 使 一 些 在 一 般 赢 级 语言 中 难以 实现 的 绘 
图 功能 , 在 MATLAB 语言 中 , 一 个 指令 就 可 完成 ,为 化 学 计量 学 工作 者 提供 了 极 大 的 方便 ， 
可 使 我 们 摆脱 一 些 在 计算 机 编程 方面 的 技术 人 性 操作 ， 而 将 主要 箱 力 集 中 到 化 学 计量 学 新 算法 
的 思路 研究 之 上 。 

随 着 计算 机 科学 的 不 断 普及 ， 有 关 MATLAB 语言 的 书籍 也 在 相继 出 现 (RA BR 
UD. 在 这 些 书籍 中 ,主要 介绍 MATLAB 语言 的 - - 些 基 本 知识 和 概念 ,读者 参看 这 些 书 籍 ， 
即 可 方便 地 知道 MATLAB ZAER., MATLAB 语言 的 变量 与 语句 ， 数 值 输 入 与 输出 格式 ， 
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MATLAB 系统 工作 空间 信息 , 以 及 MATLAB 的 在 线 帮助 功能 等 . 对 于 这 些 知识 我 们 在 此 就 
不 作 详 细 介 绍 了 , 读者 可 直接 阅读 这 些 书籍 . 其 实 , 学 习 MATLAB 语言 , 如 果 读 者 已 有 一 般 
高 级 语言 的 基础 ， 很 短 的 时 间 就 可 完全 进入 角色 ， 至 于 - - 些 细节， 读者 可 在 继续 的 实践 中 不 
断 提高 .在 这 里 ,我 们 给 出 的 就 是 一 些 证 污 者 可 直接 进入 MATLAB 编制 化 学 计量 学 一 般 程序 
一 些 最 基本 知识 ,希望 读者 经 过 阅读 本 节 , 对 怎样 使 用 MATLADB 语言 米 进行 化 学 计量 学 研究 
有 个 大 致 了 解 ,有 关 MATLAB 语言 的 -- 些 细节 问题 希望 读者 参阅 有 关 MATLAB 语言 介绍 
的 专门 书籍 。 


—. MATLAB 系统 简介 


MATLAB 系统 是 由 美国 Mathworks 公司 推出 的 用 于 数值 计算 和 图 形 处 理 的 科学 计算 系 
RRS, MATLAB 是 英文 Matrix Laboratory ӨН ЮЗ 缩写 . 它 集中 了 日 常数 学 处 理 中 
的 各 种 功能 , 包括 高 效 的 数值 计算 ,矩阵 运算 、 信息 处 理 和 图 撒 生成 等 功能 , 在 MATLAB Ж 
ЖТ, 用 户 可 以 集成 地 进行 程序 设计 、 数值 计算 、 图 形 绘制 、 输 入 输出 、 文件 管理 等 各 项 操作 

MATLAB 提供 了 一 个 人 机 交 下 的 数学 系统 环境 ,该 系 统 的 基本 数据 竺 构 姨 定 阵 , 在 构成 
矩阵 对 象 时 ,不 要 求 明确 的 维 数 说 明 。 与 利用 C 语言 或 FORTRAN 诸 言 作 数 值 计算 的 程序 设 
计 相 比 , 利用 MATLAB 可 以 节省 大 量 的 编程 时 间 。 在 美国 的 一 些 大 学 里 ，MATIAB, 正在 
成 为 对 数值 线性 代数 以 及 其 他 一 些 高 等 应 用 数学 课程 进行 辅助 教学 的 有 益 工 具 。 在 化 学 计 基 
学 研究 中 ，MATLAB 是 一 种 很 好 的 算法 研究 工具 ， 

МТАТАВ 系统 由 五 个 主要 部 分 组 成 ,下 面 分 别 加 以 介绍 。 

(1) MATLAB 语言 体系 MATLAB 是 高 层次 的 年 阵 /数组 语言 , 其 有 条 件 控制 、 因数 调 
用 、 数 据 结构 、 输 入 输出 、 面 向 对 象 等 程序 语言 特性 。 利 用 它 既 可 以 进行 小 规模 编程 ， 完 成 
算法 设计 和 算法 实验 的 基本 任务 ， 也 可 以 进行 大 规模 编程 ， 开 发 复杂 的 应 用 程序 。 

(2) MATLAB 工作 环境 MATLAB 工作 环境 是 MATLAB 提供 给 用 户 使 用 的 管理 功 
能 的 总 称 ， 包 括 管理 工作 空 局 中 的 变量 ， 数 据 输入 输出 的 方式 和 方法 ， 以 及 开发 调试 、 管 
理 文件 的 各 种 工具 。 

3》 图形 名 柄 (handle) 系统 ”图形 句柄 Chando 系统 是 MATLAB 图 形 系统 的 基础 , AL 
括 完成 数据 图 示 、 图 像 处 理 、 动 画 生成 、 图 形 显示 等 功能 的 高 层 MATLAB 命令 . 也 包括 用 户 
对 图 形 图 僚 等 对 象 进 行 特性 控制 的 低 良 MATLAB 命令 ， 以 及 开发 应 用 程序 的 各 种 工具 。 

(4) MATLAB 数 学 函数 库 这 是 对 MATLAB 使 用 的 各 种 数学 算法 的 总 称 , 包括 各 种 初 
等 函 归 的 算法 .也 包括 矩阵 运算 、 怎 阵 分 析 等 高 层次 数学 算法 。 

(5) MATILAB 应 用 程序 接口 (APD MATLAB 为 用 户 提供 了 一 个 函数 库 , 使 得 用 户 能 
够 在 MATLAB 环境 中 使 用 C 程序 或 FORTRAN 程序 , 包括 从 MATLAB 中 油 用 子 程序 ( 动 
SHE). BE MAT 文件 的 功能 。 

综 上 所 述 , 可 以 看 出 MATLAB 是 一 个 功能 十 分 强大 的 系统 ， 是 集 数 第 计算 、 图 撒 管理 、 
程序 开发 为 一 体 的 环境 . 除 此 之 外 , MATLAB 还 具有 很 强 的 功能 扩展 能 力 , 与 它 的 主 系统 -- 
起 , 可 以 配备 各 种 各 样 的 工具 箱 , 以 完成 一 些 特定 的 任务 。 目前 , MathWorks 公司 推出 了 18 种 
工具 箱 。 用 户 还 可 以 根据 自己 的 工作 任务 ， 开 发 自己 的 上 具 箱 。 


=. MATLAB 的 工作 环境 


启动 MATLAB # Ja , Windows 的 工作 平台 上 会 弹出 一 个 窗口 ， 命 令 窗口 是 用 户 与 
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MATLAB ARRETA BUT TERRE, REO)” Жл MATLAB 解释 器 正 等 待 用 户 输入 
#5. MAR MATLAB #4, MATLAB 函数 , ЦА MATLAB 程序 都 要 在 这 个 窗口 下 运行 。 

在 命令 窗口 中 ， 用户 可 以 发 出 MATLAP AS. 例如， 为 了 牛 成 一 个 3X3 阶 的 和 矩阵， 可 
在 提示 符 下 ， 键 人 如 下 的 命令 ， 

А=[1 23; 4 5 6: 7 8 9] 

方 插 号 命令 表示 矩阵 , 空格 将 每 个 的 元 素 分 开 , 而 分 号 将 矩阵 的 各 行 数值 分 开 。 再 键入 Enter 
{ 回 车 ) 后 ，MATLAB 将 回 显 如 下 的 和 矩阵， 

A= 


7 8 9 
Hy TOR GSR EE. SY ESE A tS 

) B=inv(A); 
WA ЕРЕ Ай. 其 结果 将 存 人 和 矩阵 BB 之 中 。 如 果 不 想 在 命令 窗口 中 显示 计算 结果 ,只 
要 如 上 所 示 , 在 该 命令 后 多 键 人 一 个 分 号 即 可 . 此 时 , MATLAB 系统 只 完成 该 命令 所 要 求 的 
计算 任务 ， 其 计算 结果 不 回 显 。 这 项 功能 在 程序 设计 中 是 非常 有 用 的 . 

由 于 MATLAB 的 运算 功能 很 强 ， 所以， 它 的 这 种 类 似 于 BASIC 语言 的 、 具 有 很 强 的 对 
话 功 能 的 工作 环境 对 化 学 计量 学 程序 调试 和 编制 有 很 大 好 处 。 如 计算 报 小 二 乘 回归 ， 输 入 了 
校正 矩阵 X 和 响应 矢量 了 后 , 在 MATLAB 的 工作 环境 下 . 直接 用 以 下 语句 就 下 得 到 需求 解 
MBM hit RM CK: 

) C=inv (X'*X) *X'*Y 

ERB Al}. ЖОЛОН РЕШЕ E, ARRE. S SOURCE ER ALA MATLAB 进行 化 学 计量 
学 运算 ， 我 们 在 此 先 对 MATLAB BU— Ris SERES жр GRRE RETA. 


=. MATLAB 的 一 般 运 算 符 号 和 矩阵 运算 功能 


在 化 学 计量 学 的 研究 和 应 用 中 ， 由 于 大 都 是 进行 多 变量 运算 ,矢量 和 和 矩阵 是 基本 运算 单 
元 ， 所以, 熟悉 MATLAB 的 矩阵 运算 功能 是 用 MATLAB 语言 来 进行 化 学 计量 学 研究 的 
基础 。 

在 MATLAB 系统 中 , 只 管理 着 一 种 对 象 (Object) 一 一 矩阵 (UMRE), 1X1 的 矩阵 
实际 上 是 一 个 标量 即 一 个 数量 , 任何 数 在 MATLAB 系统 中 是 作为 1X1 的 矩阵 来 处 理 的 . 与 
数学 术语 一 样 , 仅 有 一 行 或 一 列 的 矩阵 称 为 向 量 . MATLAB 的 大 部 分 运算 或 命令 是 在 矩阵 运 
算 的 意义 下 执行 的 。 

(一 ) MATLAB 的 基本 运算 符 

1. ERE (算术) 运算 符 

MATLAB 的 主要 矩阵 (算术 ) 运算 符 如 下 所 列 : 

A', 表示 矩阵 ANE, 如果 АЖЫ. MK ZAHARARBRE: 

A+B: ЖА ЯП В MA, RRAMERN TAH BM. 如 里 AM BRE. 则 
表示 两 个 数 相 加 ; 

A—B. 表示 和 矩阵 A 和 B 的 差 , 表示 两 个 抢 阵 的 元 素 对 应 相 减 , ha Et A 和 BB 都 是 标量 , ИП 
表示 两 个 数 相 减 ， 
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A * В; ЖШШЕ AM B HRE, AY BIT ЖЕШ kini. RES eM 
А. +6: ВАЯВ Mt Bi л ЖАНЕ, AMBY Fel He OE E АЕК 2 — у, 


A/B; 表示 方程 x * A=B 的 解 zi 
ANB: ERDF Ax c=B A z; 


А. /В: Sn BE A HERRER B Ау OR, ВЕГАС D BG. A 和 8 为 同 


维 数 的 矩阵 ,除非 其 中 之 一 为 标量 ， 


A.NB SUR kE BE ВИШЕ АУЛ АР ВС. ЈАС, 1A 和 B 为 同 


维 数 的 矩阵 ,除非 其 中 之 一 为 标量 。 
2. 矩阵 的 创建 


可 以 使 用 下 列 任何 一 种 方法 在 MATLAB 环境 下 创建 或 输入 一 个 托 阵 : 


D 显 水 地 输入 一 个 元 素 序列 ， 


@ RI MATLAB 的 内 部 函数 创建 一 个 矩阵 ; 

© EM 文件 中 用 MATLAB 语句 创建 一 个 年 阵 

D 从 一 个 外 部 数据 文件 中 装载 并 创建 一 个 矩阵 。 

Ж MATLAB 环境 中 ,不 需要 对 创建 的 变量 对 象 给 出 类 型 说 明和 维 数 说 明 , 所 有 的 变 基 都 
作为 双 精 度 的 矩阵 来 分 配 内 存 空 间 和 存储 空间 。 MATLAB 将 自动 地 为 每 一 个 变量 分 配 内存 ， 
最 简单 的 创建 甜 阵 的 方法 是 显示 地 输入 矩阵 的 元 素 序 列 。 上 其 体 方法 如 下 ;将 矩阵 的 元 素 用 力 括 
号 括 起 来 , 按 和 矩阵 行 的 顺序 输入 各 元 素 , 元 素 与 元 素 之 问 用 空格 或 还 号 分 开 , 用 分 导 将 每 行 的 
元 素 分 开 。 例 如 ,在 键入 下 列 的 MATLAB #0; 


) A=[1 3 5 7 ; 1 2 3 5 
Ja» MATLAB 执行 该 语句 的 输出 结果 是 
A= 


或 者 , ША 
) a—[2,3.4,6:1,4,5,7] 
它 的 输出 结果 是 : 
a= 
2 з 4 8 
1 4 5 7 
注意 ， 行 与 行 之 间 都 是 用 分 号 来 隔 开 的 。 
3. MATLAB 的 常用 数学 函数 


з; 3 9 9 1 


MATLAB 提供 了 几乎 所 有 的 常用 的 初等 函数 , 函数 的 变量 在 MATLAB 中 被 规定 为 矩阵 
变量 ， 运 算法 则 是 将 函数 逐 项 作用 于 和 矩阵 的 元 素 上 ， 因 而 运算 的 结果 是 一 个 与 自 变量 同 维 数 


的 矩阵 。 例 如 : 
) A—[123 245 365 
345 345 232] 
› B—fix(0. 45 * A) 
) C=cos(A? 


这 三 条 语句 运算 的 结果 分 别 是 
A= 

123 245 365 

345 345 232 


55 110 164 
155 155 104 


—0.8880 0.9990 0.8391 
0.8391 0.8391 0.8880 
MATLAB 提供 的 三 角 函 数 主要 包括 有 


sin IE SK PAK 
cos RK BR 
tan 正切 函数 ; 


asin HERB; 

acos 反 余弦 函数 ， 

atan 反正 切 函 数 ， 

sinh АХ IE SE РАЖ: 

cosh 双 曲 余弦 函数 ; 

tanh 双 曲 正切 函数 ; 

asinh — 反 双 曲 正 弦 函 数 ， 

acosh БЕЯ; 

atanh ë 反 双 曲 正切 函数 。 
MATLAB 提供 的 初等 函数 包括 有 : 
abs 实数 的 绝对 值 、 复 数 的 模 、 字 符 串 的 ASC 1 码 值 ; 


ange ЯН: 
sqrt HREN: 

real 复数 的 实 部 ， 
imag 复数 的 虚 部 ; 


conj LETS E 

round ”最 邻近 整数 截断 〈 四 舍 五 人 ); 
fix 向 零 方向 裁 断 为 整数 ， 

floor 不 大 于 自 变量 的 最 大 整数 ; 
ceil 不 小 于 自 变 量 的 最 小 整数 ; 
sign 符号 函数 ， 

rem 求 余数 或 模 运算 ; 

ged 最 大 公 因 子 ， 

lem 最 小 公 倍 数 ; 

exp 自然 指数 函数 (Ll e 为 底 ); 
log 自然 对 数 函数 《以 。 为 底 ); 


3 
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log10 — D 10 为 底 的 对 数 函 数 。 

为 了 方便 应 用 ，MATLAB 还 提供 了 一 些 特殊 的 数学 函数 ， 主 要 包括 有 : 

bessel Bessel 函数 ， 

beta 完全 与 不 完全 Beta 函数 ; 

rat ARIE 

erf 误差 函数 ; 

erfinv REAR. 

上 述 函数 基本 上 都 是 按 和 矩阵 的 元 素 进行 运算 ， 

4.， 几 个 可 方便 产生 矩阵 和 矢量 的 方法 

直接 从 MATLAB 的 命令 窗口 输入 矩阵 和 矢量 确实 是 方 使 , 但 是 ,这样 做 的 效率 不 高 , 在 
MATLAB Ф, 有 几 个 可 方便 产生 矩阵 和 矢量 的 方法 ， 这 将 使 我 们 的 编程 效率 提高 , 在 此 我 们 
给 出 简要 介绍 。 

冒号 运算 符 使 得 数据 向 量 的 创建 变 得 十 分 容易 。 为 了 得 到 一 个 紧 型 的 函数 数据 表 ， 只 需 
先 用 冒号 运算 符 生 成 行 向 量 ， 再 转 置 ， 计 算出 函数 值 列 ， 就 可 用 两 列 数据 拼 成 一 个 函数 数据 
K, PA: 

) x=[G 0:02:30]; 

) у= —ехр(х). * sin(x); 


) [ху] 
ans= 

0 v 
0. 2000 —0. 2427 
0. 4000 — 0. 5809 
0. 6000 —1. 0288 
0. 8000 —1. 5965 
1. 0000 — 2.2874 
1. 2006 — 3. 0945 
1. 400€ — 3.9962 
1. 6006 —4. 9509 
1. 800€ —5. 8914 
2. 000€ — 6. 7188 
2.2000 —7.2967 
2. 4000 — 1. 4497 
2.6000 —6. 9406 
2. 800€ — 5. 5088 
3. 0000 — 2. 8345 


能 够 创建 向 量 的 其 他 函数 还 有 : logspace 函数 ， 用 于 创建 对 数 等 距 的 向 量 ; linspace 函数 ， 
用 于 创建 指定 长 度 的 等 距 向 量 。 例 如 : 

》LINSPACE(zxl1, z2, nn) 就 可 产生 一 个 含 * 个 元 素 的 行 向 量 , 它 的 第 一 个 元 素 是 11, 最 
后 一 个 元 素 是 zx2， 元 素 与 元 素 之 间 的 差 值 是 相等 的 。 

如 键入: 
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) linspace(. 3,5. 2,14) 
所 得 结果 显示 如 下 : 
ans = 
Columns 1 through 7 
0. 3000 0.6769 1. 0538 1. 4308 1.8077 2.1846 2.5615 
Columns 8 through 14 
2. 9385 3. 3154 3.6923 4.0692 4.4462 4. 8231 5.2000 
WAK LINSPACE Gc1 5.22.2) PAY n WEE, Ш LINSPACE(Cz1,z2), MATLAB 就 产生 一 
AH 100 个 元 素 的 行 向 量 。 
MATLAB 还 提供 了 一 类 函数 ， 可 用 于 创建 某 些 特殊 类 型 矩阵 ， 这 些 函 数 主 要 包括 有 : 
diag 向 量 的 对 角 矩 阵 ; 
hadamard Hadamard 矩阵 ; 


magic ЕЖЕ, 
pascal HEZA: 
zeros 元 素 全 为 零 的 矩阵 ; 
ones 元 素 全 为 1 REE 
rand 元 素 为 均匀 分 布 的 随机 矩阵 ， 
randn FORA ESD A: É) ES ; 
eye 单位 矩阵 。 
例如 ， 为 了 创建 一 个 3X5 的 随机 矩阵 ， 只 需 输 入 下 列 语句 : 
) rand(3,5) 
即 可 得 


ans= 
0.9501 0.4860 0.4565 0.4447 0.9218 
0.2311 0.8913 0.0185 0.6154 0.7382 
0.6068 0.7621 0.8214 0.7919 0.1763 
这 为 我 们 进行 计算 机 数字 模拟 带 来 很 大 方便 。 
5. MATLAB 的 矩阵 角 标 系统 
为 标记 矩阵 的 每 个 元 素 的 位 置 ,数学 上 用 该 元 素 在 矩阵 中 的 行 、. 列 标号 来 表 未 .MATLAB 
也 使 用 类 俱 的 方法 来 表示 ， 这 与 一 艇 计算 机 高 级 语言 没什么 差别 .不同 的 是 , MATLAB 约定 
矩阵 的 角 标 可 以 是 一 个 向 量 。 对 和 矩 阵 来 说 ,可 以 利用 向 量 角 标 沪 问 矩阵 的 子 和 矩阵 就 十 分 方便 
T. MATLAB 的 筷 阵 角 标 系统 在 化 学 计量 学 的 应 用 中 起 到 十 分 重要 的 作用 。 
ЖШ. # 4 是 一 个 10X10 的 矩阵 ， 那 么 语句 
У АЛ. 5, 2 
表示 创建 一 个 5X1 的 列 向 量 ， 由 矩阵 4 的 第 三 列 前 5 AERAR, Vina 
» AG; 5, 7; 10) 
表示 创建 一 个 新 的 5X4 阶 和 矩阵 , 由 矩阵 A 的 前 五 行 后 四 列 的 元 素 组 成 , 即 为 4 的 一 个 子 块 。 
在 这 种 表示 方法 中 ， 单 用 骨 号 作 角 标 时 ， 表 示 该 矩阵 的 全 部 行 或 全 部 列 。 例 如 ， 请 句 
AG, 8) 
表示 矩阵 4 的 第 三 列 ， 而 
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» A(l:5,:) 
RTE A 的 前 五 行 。 

算 阵 的 角 标 表示 可 以 用 在 赋值 语句 中 ， 这 是 MATLAB 中 年 阵 运算 的 一 种 技巧 。 例 如 ， 
BRA 

) В= magic( 8) 


得 
B= 
64 2 з 61 в 6 7 57 
9 5 54 12 33 51 50 16 
п 47 46 20 21 43 42 A 
40 26 2 3 3 3 31 33 
3 34 85 29 28 38 3 25 
4l 23 22 44 45 19 18 48 
49 15 м 5 53 и 10 56 
8 58 59 5 4 62 63 1 
再 键 人 
) a=rand(8) 
得 
a= 
0.9501 0.8214 0.9356 0.1389 0.4451 0.8381 0.3046 0.3784 
0.2311 0.4447 0.9169 0.2028 0.9318 0.0196 0.1897 0.8600 
0.6068 0.6154 0.4103 0.1987 0.4660 0.6813 0.1934 0.8537 
0.4860 0.7919 0.8936 0.6038 0.4186 0.3795 0.6822 0. 5936 
0.8913 0.9218 0.0579 0.2722 0.8462 0.8318 0.3028 0. 4966 
0.7621 0.7382 0. 3529 0.1988 0.5252 0.5028 0.5417 0.8998 
0.4565 0.1768 0.8132 0.0153 0.2026 0.7095 0.1509 0.8216 
0.0185 0.4057 0.0099 0.7468 0.6721 0.4289 0.6979 0.6449 
再 键入 
) aCo[35 7 D-BG.1:32 
则 可 得 


a= 
0.9501 0.8214 64.0000 0.1389 2.0000 0.8381 3.0000 0. 3784 
0.2311 0.4447 9.0000 0.2028 55.0000 0.0196 54.00C0 0.85600 
0.6068 0.6154 17.0000 0.1987 47.0000 0.6813 46.0000 0.8537 
0.4860 0.7919 40.0000 0.6038 26.0000 0.3795 27.0000 0.5936 
0.8913 0,9218 32.0000 0.2722 34.0000 0.8318 35.00C0 0.4966 
0.7621 0.7382 41.0000 0.1988 23.0000 0.5028 22.0060 0.8998 
0,4565 0.1763 49.0000 0.0153 15,0000 0.7095 14.000 0.8216 
0.0185 0.4057 8.0000 0.7468 58.0000 0.4289 59.0000 0.6449 

从 上 述 过 程 可 以 看 出 ， 矩阵 “的 第 3 列 、 第 5 列 和 第 7 列 分 别 被 矩阵 B 的 前 三 列 代 蔡 了 。 
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一 般 地 , IR Ae 都 是 整数 元 素 向 量 , 那么 ACtv,w) 表 示 的 是 一 个 取 自 AMEE FR. 
行 由 向 量 v 确定 ， 而 列 由 向 量 w 确定 ， 称 "为 行 角 杯 ， 为 列 角 标 。 ` 

另外 ,在 MATLAB фи, Hai PEM TEE а 的 列 反 序 的 矩阵 ， 如 键 人 

》ak:.8: 一 1:1) 


就 可 得 
ans= 
6.3784 3.0000 0.8381 2.0000 0.1389 64.0000 а. 8214 0.9501 
€.8600 54.0000 0.0196 55. 0000 0.2028 5.0000 0.4447 0. 2311 
0.8537 46.0000 0.6813 47.0000 0.1987 17.0000 0.6154 0.6068 
€.5936 27.0000 0.3795 26.0000 0.6038 40.0000 0.7919 0.4860 
C.4966 35.0000 0.8318 34.0000 0.2722 32.0000 0.9218 0.8913 
C.8998 22.0000 0.5028 23.0000 0.1988 41.0000 0.7382 0.7621 
£.8216 14.0000 0.7095 15.0000 0.0153 49.0000 0.1763 0. 4565 
€.6449 59,0000 0.4289 58.0000 0.7468 8.0000 C.4057 0.0185 


这 样 , MATLAB 用 来 进行 矩阵 的 分 块 , 重 排 等 很 难 在 一 般 计算 机 高 级 语言 实现 的 功能 变 
得 十 分 容易 了 。 

在 化 学 计量 学 中 ,我 们 经 常 需要 将 矩阵 进行 矢量 化 而 后 计算 ,这 在 MATIAB 中 也 是 很 容 
BEAM, Pla, a) 

»A-[ 2:3 445 6] 

) b-ACO 
的 输出 结果 

А: = 


值得 提出 的 是 ，4(: ) 语 句 如 在 赋值 语句 的 左 端 , 还 可 表示 用 一 个 向 量 对 矩阵 4 RET 
FRR, HR A 必须 事先 存在 。 例 如 ， 设 4 是 上 述 的 3X2 阶 的 矩阵 ， 那 么 语句 

? ACG=11:16 
则 表示 行 血 量 С11. 12, 13, 14, 15, 16] 的 6 个 元 素 依照 矩阵 4 的 列 顺 序 给 4 ДОЛОН. 
但 保持 矩阵 4 的 维 数 3X2， 因 此 ， 


A= 
11 14 
12 15 
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MATLAB 的 函数 reshape 正 是 使 用 这 种 方法 来 改变 一 个 矩阵 的 维 数 的 。 一 般 说 来 ， 矩阵 
的 角 标 出 现在 语句 等 号 的 丰 端 时 ， 表 示 创建 一 个 新 的 矩阵 对 象 ; 在 左 端 时 ， 则 表示 对 原 矩 阵 
中 的 部 分 或 全 部 元 素 重新 赋值 。 

Ж MATLAB 中 , 还 可 用 所 谓 的 矩阵 的 0-1 角 标 来 定义 矩阵 子 块 , 这 样 就 可 以 用 关系 运算 
的 结果 来 引用 和 矩阵 的 元 素 或 子 据 ， 这 在 一 些 数学 计算 中 是 十 分 有 意义 的 。 假 设 a 一 rand(8) 是 
一 个 8X8 ИЕЛ Ж. 1, 是 一 个 长 度 为 mm 的 0-1 向 量 , BA AL, D 表示 由 向 量 工 的 非 


零 元 素 对 应 的 矩阵 4 的 行 组 成 的 子 块 。 如 ， 


7446 
2679 
4399 
9334 
6833 
2126 
8392 
6288 


a—rand(8) 
得 
》a 一 
0.4387 0. 
0.4983 0. 
0.2140 0. 
0.6435 0. 
0.3200 0. 
0.9601 0. 
0.7266 0. 
0.4120 0. 
则 如 键 人 
)L-aG,202-.5 
可 得 
工 一 
0 
o 
1 
1 
0 
1 
0° 
° 
FRA 
» b=a(L,:) 


可 得 到 a SERRE РИ: 


b= 


oF? 


1338 
2071 
6072 
6299 


‚3705 


5751 
4514 
0439 


еееоеооее е 


. 0272 


3127 
0129 


. 3840 
. 6831 


0928 
0353 


‚6124 


ое еее о ое о р 


. 6085 
. 0158 


0164 
1901 
5869 
0576 
3676 
6315 


0.2140 0.4399 0.6072 0.0129 0. 0164 


0. 6435 
0. 9601 


) c=b(b<=. 3) 


0.9334 0.6299 0.3840 0.1901 
0.2126 0.5751 0.0928 0.0576 
T BEES MT ARIE SPAT 0.3 的 元 素 ， 而 且 还 可 将 其 矢量 化 ， 


‚7176 
. 6927 
0841 
4544 
4418 
‚3533 
1536 
6756 


ее еә о оо е е 


0. 0841 


. 6992 
7215 
4784 
5548 
1210 
4568 
7159 
. 8928 


оо е oe eee 


rau ое ое е 


‚2731 


2548 
8656 
2324 


. 8049 


9084 
2319 


.2393 


0.4784 0.8656 
0.4544 0.5548 0.2324 
0.3533 0. 4508 0. 9084 
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2140 
‚2126 
0129 
‚0928 
‚0164 
1901 
. 0576 
‚ 0841 
0. 2324 

RE. MATLAB FT UL ii Ae PETE ЯЕ BOR MAKE. ИШ, ШЖ A En TIER. 
ЖА, B 

) C=[AA'; ones(size(A))A. ^ 2]; 

RADE -- + 2n 阶 的 方 阵 。 在 这 样 的 运算 中 ， 要 保持 矩阵 阶 数 的 协调 性 ， 否 则 
MATLAB 系统 会 报告 运算 出 错 。 

示例 ， 如 键入 
) x=magic(4) 
得 


е е се о ос о ос 


再 键 人 

》y 一 [x x';ones(size(x))x. ^ .5] 
则 可 得 

y= 

16.0000 2.0000 3.0000 13.0000 16.0000 5.0000 9.0000 4.0000 

0000 11.0000 10.0000 8.0000 2.0000 11.0000 7.0000 14.0000 
0000 7.0000 6.0000 12.0000 3.0000 10.0000 6.0000 15.0000 
0000 14.0000 15.0000 1.0000 13.0000 8.0000 12.0000 1.0000 
0000 1.0000 1.0000 1.0000 4.0000 1.4142 1.7821 3.6056 
.0000 1.0000 1.0000 1.0000 2. 2361 3. 3166 3.1623 2.8284 
-0000 1.0000 1.0000 1.0000 3.0000 2.6458 2.4495 3.4641 
.0000 1.0000 1. 6000 1. 0000 2. 0000 3. 7417 3.8730 1.0000 

为 了 实现 由 一 个 矩阵 创建 新 的 矩阵 , 以 及 对 和 矩阵 的 运算 进行 管理 , MATLAB 提供 了 一 些 
功能 函数 ， 主 要 包括 有 

rot90 ”将 矩阵 旋转 90 BE, 

гр KERAF (ZERP); 

flipud ”将 矩阵 的 行 反 序 《 上 下 反 序 ); 


a 
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diag SEN MLE HO ATA ERY A EMERE — Ti SE a EBE; 

tril 提取 和 矩阵 的 下 三 角 部 分 ; 

triu ЕШ L TABS: 

reshape ЖЯ КЇЙ. 

例如 ， 当 要 将 一 个 3X4 阶 矩 隆 按 照 列 的 顺序 重 排 成 2>X8 МИНЕН. LAD F FURORI 


来 实现 
У A=[147 105258 11368 12] 
得 
A= 
1 4 7 10 
2 5 8 11 
6 9 12 
再 键 人 
) B=reshape(A,2,6) 
得 
B= 
1 3 5 7 9 11 
2 4 6 8 10 12 
ЖАШ, AB F = fi E BES DA FIAR 
) tril( A? 
得 
8ns— 
1000 
2500 
3.6290 
又 如 
) flipud (A) 
得 
ans 一 
3 6 9 12 
2 5 8 1l 
1 4 7 10 
与 矩阵 运算 相关 的 另外 两 个 MATLAB nš k E: size 和 length, 函数 size( A) 的 返回 值 是 一 
个 二 元 素 的 向 量 ， 第 一 元 素 为 矩阵 4 的 行 数 ， 第 二 元 素 为 矩阵 A 的 列 数 。 在 MATLAB 中 ， 


size 的 定义 已 经 扩展 到 任何 多 维 数组 , 它 的 返回 值 是 一 个 维 数 向 量 。 如 果 已 经 知道 ” 是 一 个 向 


量 


‚ WA length (wv) 的 返回 值 是 该 向 量 的 长 度 ， 或 max(size(v)). 
更 重要 的 是 , MATLAB 还 定义 了 一 个 很 特殊 的 矩阵 , DE, EERE UL Н PSU ROHS 


句 创建 : 


)x=[ ] 


即将 一 个 0X0 ВОЗЕЛА А А г, BE Враг A. 而 不 会 导致 错误 。 利 
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ААН КЕ. UD LAD AB MBE AT А EE A A PIS S. IML, ШЫ 

) A(:.[2,4])=[ ] 
的 运算 结果 是 从 矩阵 A 中 消去 第 2 列 和 第 4 列 的 矩阵 子 块 。 在 MATLAB H, Ж MATLAB 
函数 用 空竹 阵 作 变 量 时 ， 被 赋予 了 特定 的 值 . 这 些 函 数 包 括 det CE FTIR ENA). cond ОН 
阵 的 条 件数 )、prod (各 列 元 素 之 积 ) 和 sum《 各 列 元 素 之 和 )。 例 如 ， 如 果 z EAEE, 
则 分 别 规定 此 det (к) = 1, prod(z)=1 fll sum (x) 一 0 等。 注意 ， 空 知 阵 在 化 学 计量 学 的 
MATLAB 编程 中 将 具有 十 分 重要 的 作用 。 

(=) 和 矩阵 与 数组 运算 

为 了 方便 数据 分 析 , MATLAB 提供 了 一 部 分 面向 答 阵 的 列 运算 的 数据 分 析 函 数 , 这 些 函 


数 主要 包括 有 
max 定 阵 各 列 的 最 大 值 向 量 
min ЖИ e FUE cA f Pl Ж 


mean 矩阵 各 列 的 平均 值 向 量 
median 第 阵 各 列 的 中 值 向 量 


std 矩阵 各 列 的 标准 偏差 向 量 
sum 矩阵 各 列 的 元 素 之 和 向 量 
prod 矩阵 各 列 的 元 素 之 积 向 量 


comsum 矩阵 各 列 的 累加 和 向 量 
cumprod ERE FIM ЖАЯДЫ RE 


diff KEE SP за 
hist 矩阵 各 列 的 直方 图 向 量 
сопу DIR 3631 

sort 排序 


corrcoef 矩阵 各 列 相关 系数 
对 于 向 量变 量 ， 这 些 函 数 会 把 行 向 量 和 列 向 量 都 作为 数组 来 处 理 ， 而 对 子 矩 阵 变量 ， 这 
些 晒 数 则 面向 矩阵 的 列 进行 运算 、 其 结果 是 行 向 量 。 例如， 函数 max 应 用 于 矩阵 变量 时 ， 返 
回 的 行 向 量 的 各 元 素 的 值 恰 为 巨 阵 各 列 的 最 大 值 ,用 户 可 以 自己 编写 面向 列 运算 的 函数 M 文 
件 ， 只 需 加 入 一 些 辅助 的 条 件 语句 判别 出 输入 变量 是 向 量 还 是 矩阵 。 可 以 参考 MATLAB 的 
M Xt mean. m 和 diff. m. А 
注意 , Е MATLAB 4, 以 上 这 些 函数 〈 除 最 后 一 个 函数 外 都 可 以 应 用 于 多 维 数组 。 例 
如 ， 函数 sum 的 一 般 调用 命令 为 
) sum(M,d) 
中 , M 是 一 个 =” 维 数组 , d 可 以 是 任何 表达 式 , 其 值 介 于 1 5 n 2 BJ. 它 的 作用 是 在 ” 维 数 
ма 维 方向 计算 M 的 元 素 之 和 ， 其 结果 应 该 是 一 个 ”一 1 维 数组 ， 例 如 ， 
) M= zeros(3,3,4); 


us 


) fork—1i; 4 
M(.,:5k) =k * ones (3, 3); 
end 


> sum(M,1) 


ans= 


3 6 9 12 


> sum(M, 3) 


ans = 


MATLAB 通过 其 矩阵 运算 , 提供 了 强 有 力 的 数学 运算 功能 , 这 正 是 MATLAB 在 化 学 计 
量 学 研究 中 最 有 用 之 处 ， 一 些 常用 而 又 十 分 重要 的 矩阵 运算 算法 被 直接 设计 成 MATLASB 的 
核心 程序 ,而且 运算 速度 很 快 ,从 而 使 得 化 学 计量 学 的 算法 研究 用 MATILAB 来 编程 变 得 十 分 
简单 。 

和 矩阵 分 解 是 化 学 计量 学 研究 的 核心 ， 很 多 算法 大 都 基于 矩阵 分 解 ， 只 要 熟练 学 握 了 称 阵 
分 解 的 基本 思路 和 基本 算法 ， 将 为 化 学 计量 学 的 进一步 研究 打下 了 良好 的 基础 。 

1， 三 角 分 解 

和 矩阵 的 三 角 分 解 是 最 基本 的 一 种 矩阵 分 解 方法 ， 它 将 一 个 矩阵 分 解 成 上 三 角 和 矩阵 与 下 三 
角 和 矩阵 的 乘积 ， 称 为 LU 分 解 或 LR 分 解 。 实 现 LU 分 解 的 算法 大 都 采用 Gauss 消去 法 ， 在 
MATLAB 中 ， 实 现 LU 分 解 的 函数 是 lu， 它 的 返回 值 是 分 解 后 的 矩阵 因子 ， 调 用 命令 为 

) [L,U]=lu(A) 

JeF, U E E= f EBE, 而 工 可 以 重新 排列 成 一 个 下 三 角 和 矩阵 , 使 其 主 对 角 元 素 全 为 1. 
这 些 和 矩阵 因 于 可 以 用 来 计算 矩阵 的 逆 和 矩阵 行列 式 的 值 。LU 分 解 也 是 求解 线性 方程 组 的 基 
本 算法 ， 另 外 ， 甜 阵 的 除法 以 LU 分 解 算法 为 基础 。 例 如 ， 设 有 和 矩阵 

У A=[4 5 2;7 2 1,819] 


RI 
A= 
4 5 2 
7 2 1 
819 
对 其 进行 LU 分 解 ， 直 接 调用 lu 函数 即 可 
> [L,U]=lu(A) 
得 
L= 
0.5000 1.0000 0 
0.8750 0.2500 1.0000 
1. 0000 0 о 


U= 
8. 3000 1. 0009 9. 0000 
O 4.5000 —2.5000 
0 0 —6.2500 
为 了 检验 分 解 的 正确 性 ， 计 算 两 个 矩阵 因子 之 积 的 语句 如 下 ， 
PLU 
计算 结果 为 
ans 一 
4 5 2 
7 2 1 
8 1 9 
而 矩阵 A BS EBE Эу 
) x=inv(A) 
ЖЕ MATLAB F, В inv 的 算法 之 一 是 基于 LU Е, EE inv (A) —inv(U) x inv(L)。 
矩阵 A 的 行列 式 为 
》d 一 det(A) 
一 225 


也 可 以 由 LU 分 解 的 矩阵 因子 的 行列 式 得 到 
) d=det(L) x det(U) 


d= 
— 225 
设 有 列 向 量 b=[1 3 5]， 为 了 求解 方程 Ax=b, AH MATLAB 的 矩阵 除法 ， 得 到 
» x=A\b 
得 
0. 4756 
—0. 2444 
0. 1600 
这 个 解 也 可 以 由 LU 分 解 得 到 
> y=LNb; x=U\y 
还 有 一 个 与 LU 分 解 相关 的 MATLAB 函数 , 即 chol, 函数 chol 用 于 获得 对 称 正定 矩阵 的 
Cholesky 分 解 。 
2. QR 分 解 
QR 分 解 可 将 一 个 方 阵 或 长 方 矩阵 表示 成 一 个 正 交 和 矩阵 和 一 个 上 三 角 和 矩阵 的 乘积 。 例如 ， 
设 
) A=[45 3:51 69,7 8 2,9 4 12] 
得 
A= 
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2 
9 12 
对 其 进行 QR 分 解 就 可 直接 使 用 qr 命令 
) [Q.R]-ar( A) 
其 结果 如 下 : 


4 5 
16 9 
T 3 

4 


—0, 3299 —0.2630 —0.1666 一 0.8912 


一 0.0825 一 0.7640 0.62146 0.1393 
—0.5774 —0.3500 —0.6000 0.4291 
—0. 7423 0. 4740 0. 4713 0. 0468 
R= 
—12.1244 —9. 7325 —11. 7944 
0 一 6.8029 一 2.6769 
0 0° 9.5773 
0 0 0 
ЖЕЕ О ТЕО, MER R 是 上 三 角形 的 , 主 对 角 线 下 的 元 素 为 零 . 通过 下 式 可 以 验证 
FEE Q 的 正 交 性 
QrQ 


ans= 
1.9000 0.0000 0.0000 0.0000 
0.0000 1.0000 0.0000 0.0000 
0.0000 0.0000 1.0000 0.0000 
0.0000 0.0000 0.0000 1.0000 

QR 分 解 还 能 为 MATLAB 函数 null 和 orth 提供 基本 算法 . E— ШЕЛГЕ. a Ж 
分 别 给 出 矩阵 变换 的 零 空 间 和 值 域 空 向 的 正 交 基底 。 

3 FREDE 

奇异 值 分 解 在 化 学 计量 学 中 拥有 十 分 重要 的 地 位 ， 化 学 计量 学 的 很 多 核心 方法 都 是 基于 
奇异 值 分 解 ， 如 主 成 分 分 析 、 主 成 分 回归 、 贪 最 小 二 乘 及 大 部 分 多 元 校正 和 多 元 分 辨 的 方法 
都 是 基于 奇异 值 分 解 , 它 是 矩阵 分 析 的 一 种 有 效 的 工具 . 有 兴趣 的 读者 可 以 参考 Golub 和 Van 
Loan 的 著作 《第 阵 计算 》 以 获得 更 多 信息 。 在 MATLAB 中 ， 下 而 的 语句 

) [U, S, VJ=svd(A) 
计算 矩阵 奇异 值 分 解 中 的 三 个 因子 矩阵 ， 它 们 满足 条 件 

A=U=*S<*V' 

其 中 , ERU Rp] eee V ET IE RE. 而 S St ARE, SE EE U ЖП V ТЕКЕ 
Fe ЖЕЛ ЖИЕН ARA EMR MB, ENA RK RRR 4 的 列 正 交 空间 和 行 正 交 空 
间 。 在 函数 sed 的 调用 式 中 , 如 果 只 有 一 个 输出 变量 ， 则 该 函数 返回 的 仅 是 矩阵 4 的 奇异 值 。 

使 用 矩阵 奇异 值 分 解 算法 的 MATLAB 函数 主要 有 ， MERT XX pina), EEKE 
rank A), 5E BERG Euclide 范 数 norm CA 2) 08 EME Н A EM cond (4)。 
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4， 特 征 值 分 解 

设 4 是 一 个 >Xz RE, 满足 矩阵 方程 4z 一 az 的 a 称 为 年 阵 A 的 特征 值 , 特征 值 可 以 
由 下 列 命令 求 得 : 

> eig(A) 

它 的 返回 值 是 矩阵 4 的 特征 值 。 WE А R: — ЭСЕК ВЕ, 那么 所 有 的 特征 值 部 是 
实数 。 而 下 列 形 式 的 调用 则 可 以 同时 得 到 特征 值 和 特征 向 量 ， 

у Dx D]-eigCA) 
其 中 ,矩阵 D JE PGE A, ЕВЕ с 的 列 册 对 应 的 特征 向 量 组 成 ， 使 得 方程 

Axx=x* Dr. 


例如 ; 
[x,dJ=eig(A' x А) 
得 
x= 
0.7460 —0. 4074 0. 5268 
— 0.6600 —0. 5579 0. 5031 
— 0. 0889 0.7230 0. 6851 
d= 
25.5509 0 0 
0 54.8013 0 
0 O 445.6478 


DRAM BREA, 那么 eig(4,8) 的 结果 是 使 得 方程 Az—AB= 成 立 的 广义 特征 值 组 
成 的 向 量 ， 为 了 同时 得 到 相应 的 特征 向 量 ， 可 以 用 下 别 的 命令 形式 : 
b (x.DJ=eig(A,B) 
其 中 , D 是 由 特征 值 构 成 的 对 角 和 矩阵， 而 矩阵 z 的 列 是 由 对 应 的 特征 向 量 组 成 的 ， 满 中 方程 
Axx=Bxx*D,。 


Wi. MATLAB 的 绘图 功能 


MATLAB 的 绘图 功能 很 强 , 它 在 我 们 进行 程序 调试 和 撰写 论文 时 特别 有 用 ，, 如 绘制 三 维 
图 , 等 高 线 图 等 , 可 使 一 些 在 一 般 高 级 语言 中 难以 实现 的 绘图 功能 , 在 MATIAB 语言 中 , 一 
个 指令 就 可 完成 。 在 此 我 们 也 给 出 必要 介绍 。 

首先 . 我 们 在 此 构造 一 个 80X 80 的 矩阵 ,然后 用 MATLAB 语言 来 展示 一 下 它 的 几 种 最 
常见 的 绘图 能 力 (图 12-1 一 图 12-5) 。 

BA. 

p А= [4538 

1692 

7828 

94126] 
得 

A= 


45 3 8 
16 9 2 
78 2 8 
9 4 12 6 


再 键 人 
) B=[A A';1.2 x A sqrt(A)] 
)B1=[B 3« B';2.1 = B B^ 2] 
BRA 
? plot (BLC. ,9)) 
得 


如 继续 键 人 
) subplor (221) , plot(B1(;,9),’ « -) 
) hold 

Current plot held 
) subplot(222) ;plot(B1C: 10) -'o-) 
) subplor (223) , plot (B1C; ,11),'+-') 
) subplot (224) ,plot(B1C: ,11).' * -') 
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图 12-? 


如 键 人 


) bar(B1(;,6)) 
得 


如 键入 
D) contour(B1) 
就 立即 可 得 等 高 线 图 


如 键入 
) mesh(B1) 
就 立即 可 得 其 三 维 图 


第 十 三 章 MATLAB 原 程序 自 录 及 说 阴 


1. function p = anoval(x,group) 

函数 ANOVA] 可 用 于 一 维 数据 的 方差 分 析 (analysis of variance), 主要 用 于 比较 2 或 2 
组 数据 以 上 的 均值 ， 其 原 假设 (null hypothesis) 是 这 些 组 数据 的 均值 是 相等 的 。 

2. function [h,sig,ci] = ttest (x m.alpha tail) 

MK TTEST 主要 用 于 将 样本 均值 与 --- 常 数 进 行 统计 比较 检验 。 

3. function [hy significance, ci] = ttest2(x,y,alpha,tail) 

ЖХ TTEST2 主要 用 于 将 某 样本 均值 与 另 一 样本 均值 进行 统计 比较 检验 。 

4. function x = 并 2nCny》 

POR FF2N 用 于 构建 两 水 平 全 因子 设计 表 。X = FF2N CN) 给 出 具有 N 列 、 2* 行 的 设计 
和 矩阵 X， 其 中 输入 参数 ЖЕТЖ. 

5. function design = fullfact (levels) 

函数 FULLFACT 用 子 混 合 水 平 (Mixed-level) 的 全 因子 设计 年 阵 。 输 入 矢量 参数 
LEVELS 用 于 定义 每 列 的 水 平 数 , 如 : LEVELS = [2 4 3], 函数 FULLFACT 将 给 出 -个 进 
行 24 次 试验 的 全 因子 设计 和 矩阵， 其 中 第 一 列 是 2 水 平 ; 第 二 列 是 4 水 平 ; 第 三 列 旦 3 水 平 的 
设计 。 

6. function [settings, X] = cordexch(nfactors,nruns,model) 

sñ Ë CORDEXCH 用 坐标 交换 (coordinate exchange) 数值 方法 给 出 DD- 最 优 设计 表 。 

7. function [settings, X] = daugment(startdes nruns.model) 

函数 DAUGMENT 用 坐标 交换 数值 方法 来 增加 原 已- 最 优 试验 设计 的 试验 次 数 

8，funcbon D = x2fx (x model) 

函数 X2FX J&— ^ AF BW REGSTATS, Kik CORDEXCH 及 函数 RSTOOL НІ Ж 
Zo CHAT TRAE RA -AAEE ENBE E. 

9. function [x, options] = fmins(funfen ,xyoptions grad , varargin) 

ЖХ FMINS 用 于 进行 单纯 形 局 部 优化 寻 优 。 

10. funcuon [x,OPTIONS] = fminu(FUN x, OPTIONS.GRADFUN ,varargin) 

函数 fminu 通用 局 部 最 优 算法 函数 ， 其 预 置 算法 采用 BFGS Quasi-Newton 法 。 

11. function (x, OPTIONS. lambda HESS] —niconst (FUNfen,x,OPTIONS, VLB. VUB, 
GRADfcn ,varargin) ; 

BRE NLCONST 为 下 述 函 数 的 一 个 中 间 调 用 函数 : 

CONSTR, ATTGOAL. SEMINF 和 MINIMAX. 

12. function [x, OPTIONS, lambda, HESS] = constr (FUN, x, OPTIONS, VLB, VUB, 
GRADFUN varargin) 

函数 CONSTR 用 子 对 一 个 多 变量 函数 的 约束 寻 优 、 

13. funcion [obj .bestye _hest] 一 vsgsa(DimN ,region ,belta0,dolta r,delta r limit); 


HR vsgsa 为 变 步 长 广义 模拟 退火 算法 子 程序 。 


473 


14. function obj—obj fun(loeation) 

函数 obj fun JEER ЕАК MR PART B E X BJ R£ RR, 

15. function GLPoiX —glpoix (Піт Мит , PoiNum) ; 

函数 GLPoiX 用 于 产生 在 (o. 1) 区 疝 的 好 格子 点 。 此 程序 可 用 于 2 或 3 为 维 空间 的 好 
格子 点 ， 并 将 结果 在 图 上 显示 。 

16. function [optiyreg] 一 sntoptitb,DimN ,PoiN,y,x1.x2); 

函数 sntopti 为 序 贯 数 论 优化 子 程序 。 

17. function son=mate(popu) 

З mate 为 遗传 算法 中 的 交叉 函数 。 

18. function son=mutate(popu,pmutate , mutatec) 

AM mutate 为 遗传 算法 中 的 变异 函数 。 

19. function parent =select (popufit) 

pM select Ж EFT ОЗА PETE ЗС Ж DR 

20. function offspr compet (popufit . psize) 

函数 compet 为 遗传 算法 中 的 竞争 函数 。 

21. function popufit=fitness (popuerr) 

函数 popufit 为 遗传 算法 中 用 于 计算 适应 性 的 子 程序 ， 

22, function Н = hadamard(n) 

函数 HADAMARD 用 于 产生 Hadamard #6. 

23. function [b.bint,r,rint] 一 regress(y,X alpha) 

函数 REGRESS 用 最 小 二 乘 方法 来 进行 多 元 线性 回归 

24. function regstats(responses,data, model) 

RAM REGSTATS 用 子 对 线性 模型 的 回归 诊断 .该 西数 提供 了 一 个 对 话 界 面 ,可 得 几乎 所 
有 单 点 诊断 的 信息 。 

25. function [ec,c,v]—kalmfil(x.y) ; 

БК kalmfil 可 用 于 直接 校正 的 kalmam 估计 

26. function [rig ]=ridgecal(x,y); 

函数 ridgecal AY FH РА АА a EC dh YER S 2 r RR BY 

27. function [x,dx] = Iscov(A,b,V) 

函数 LSCOV BIA 8 tz E OAR) ЗЕР. 

28. function [p.cun]=per(x.c.nume,yun); 

函数 per 为 间接 校正 的 主 成 分 回归 方法 

29. function [p, a, w, b, t, u, x, y] = pls(a, с, maxrank) 

函数 PLS 为 偏 最 小 二 乘 子 程序 

30. function [press,minlv] = Tcvpls(X, Y ,maxnumb,selectnumb); 

函数 Tcvpls 用 于 交叉 效 验 (cross-validation》 计算 . 本 程序 是 调用 的 PLS PEUT. МЫШ, 
调用 PCR 也 是 可 行 的 。 

31. function [x,w] = nnls(E,f,tol> 

函数 NNLS 用 于 解决 非 负 最 小 二 乘 问题 ， 即 所 得 回归 估计 矢量 为 非 负 矢量 。 


32. function sida— m. esti(x ,y ,iterNum) ; 


E] 


BARR. 
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函数 m esu 为 稳健 的 M 估计 程序 。 

33. function [x,y]=simuld(numc.h1,cen1,sgm1,h2,cen2,sgm2,ncise,c); 

函数 simuld 叮 用 于 产生 白色 分 析 体 系 的 模拟 校正 矩阵 x 和 模拟 混合 物 响 应 矢量 y。 每 一 
个 组 分 光谱 均 自 两 个 高 斯 峰 所 组 成 ， 侧 模拟 混合 物 响 应 矢量 y 则 由 给 定 组 分 数 Cum) 的 纯 
光谱 由 给 定 的 浓度 〈c)， 通 过 线性 加 合 而 成 。 

34, function [sig] 一 rafa(xyyyalf range stepwise); 

函数 rafs 为 一 简易 的 广义 秩 消失 因子 分 析 法 ， 其 结果 为 一 对 数 特征 值 对 相对 浓度 系数 的 
变化 图 ， 其 对 数 特征 值 的 极 小 点 所 对 应 的 相对 浓度 系数 值 即 为 所 求 。 

35. function [kons ]=lorbm(x.s,c,rank); 

函数 lorbm 为 一 广义 秩 消失 因子 分 析 法 的 Lorber 方法 ,其 结果 为 混 人 台 物 中 所 会 标 准 物 质 
相对 浓度 系数 值 。 

36. function [con] —rbl(x .y ,ranky ,num ,noise) 

函数 rbl 为 残 差 双 线性 分 解 算法 子 程序 。 

37. function [bakl,bak2,bk1,bk2J—bakremo(action,x); 

函数 bakremo 可 用 于 2 维 数据 的 背景 扣除 , 该 程序 应 与 函数 name 联合 使 用 . 该 程序 提供 
T -个 图 界面 ， 用 户 就 直接 用 鼠标 在 图 上 将 峰 徐 前 一 段 零 组 分 区 与 峰 艇 后 一 段 等 组 分 区 点 出 
即 可 。 

38. function [puprof, puspec ]—als(x,pusinisiternum); 

函数 als 为 交换 最 小 二 乘 (alterative least squares) FAF. 该 程序 在 选 代 过 程 中 提供 了 一 
个 图 界面 ， 用 户 就 直接 用 鼠标 在 图 上 将 光谱 或 色谱 中 为 负 的 部 分 点 出 即 可 。 

39. function [eig,eig1]=evol(x,tim); 

函数 evo 为 渐进 因子 分 析 子 程序 。 它 将 给 出 计算 所 得 的 前 十 个 特征 值 的 对 保留 时 间 对 数 
变化 图 ， 以 确定 各 组 分 的 流出 和 消失 点 。 

40. function [SSJ=spce(X); 

函数 spc 为 子 窗口 因子 分 析 方 法 子 程序 。 其 方法 的 基本 思路 和 算法 可 参见 第 六 章 。 

本 程序 提供 了 一 个 友好 界面 ， 用 户 只 需 用 鼠标 定义 两 个 相 邻 多 组 分 区 域 ， 且 该 两 个 多 组 
分 区 域 都 含有 一 个 共同 组 分 ， 则 可 得 到 该 组 分 的 纯 光 谱 ， 

41. function [pure ]=Orthopro(x); 

函数 Ortbopro 为 正 交 投影 分 辩 子 程序 。 其 方法 的 基本 思路 和 算法 可 参见 第 五 章 。 

本 程序 提供 了 一 个 友好 界面 ， 用 户 只 需 用 鼠标 定义 两 个 相 邻 多 组 分 区 域 ， 且 该 两 个 多 组 
分 区 域 都 含有 一 个 共同 组 分 ， 则 可 得 到 该 组 分 的 纯 光谱 。 

42, function b—lsq(x y) 

函数 lsq ЭЖ ЛИЕ, SRATH BRIA. 

43. function [x ]=movpea(action,x,in1) 

函数 movpea 可 用 于 动态 局 部 主 成 分 分 析 ， 通 过 滑动 条 即 可 对 数据 矩阵 的 任 一 部 分 进行 
固定 窗口 的 主 成 分 分 析 。 

44. function name 

函数 name 为 一 与 函数 bakremo, MA movpca 共同 使 用 的 程序 ， 以 保证 全 局 变量 的 安全 
使 用 。 使 用 该 函数 时 ， 将 要 用 的 2 维 数据 矩阵 名 以 字符 串 输 入 即 可 。 


45. function [scores,loads,ssq.res] = pca(data, plots,scl,lv) 
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函数 pea 用 于 主 成 分 分 析 计 算 。 

46. function [C,S ]=rescomp(X ,indices); 

函数 rescomp 为 在 每 个 化 学 组 分 都 有 选择 性 信息 时 的 分 辩 程 序 。 

47. function [C, S, Xred |= respart (X ,indices,numc); 

函数 respart 为 在 部 分 化 学 组 分 有 选择 性 信息 时 的 分 辩 程 序 。 

48. function indices=scoop(X); 

函数 scoop 可 用 于 通过 特征 投影 图 来 找到 组 分 的 选择 性 信息 。 这 样 得 到 的 信息 可 用 于 下 
一 步 的 分 辨 。 

49. function y=selnorm(x,thres); 

函数 selnorm HIT MCSE PEAT ER ER EL. DUROS PRED 28 ОРЕК B Ay UIS 
HHEH, 

50. function indices =seqrank (X , noiselimit) ; 

函数 seqrank 可 用 于 特征 结构 跟踪 分 析 , 以 得 到 保留 时 间 方 向 的 化 学 秩 图 , 该 程序 提供 了 
一 个 图 界面 ， 用 户 就 直接 用 鼠标 在 图 上 将 可 能 的 选择 性 区 域 点 出 ， 程 序 就 可 对 该 区 域 进行 计 
算 ， 并 通过 对 话 ， 要 用 户 确定 它 是 否 是 选择 性 区 域 ， 一 经 确定 ,程序 将 自动 将 该 区 域 计 下 。 
51. function [simu зу .y1 ] -:Simu2D 
函数 Simu2D 为 产生 二 维 数据 的 计算 机 模拟 程序 .最 高 可 产生 包含 多 组 分 混合 体系 ,本 程 
序 采 用 对 话 形式 来 输入 模拟 所 需 参数 。 每 个 光谱 由 两 个 高 斯 峰 所 组 成 ， 每 个 色谱 由 一 个 高 斯 
LI 

52. Zoom 

PAM Zoom 为 二 维 作 图 缩放 功能 函数 。 

53. function class = classify (sample ,training group? 

函数 CLASSIFY 为 线性 判别 分 析 子 程序 。 

54. function d 一 mahal(Y,X); 

函数 MAHAL 为 计算 Mahalanobis 距离 的 于 程序 。 

55. function [center, U, obj. fcn] = fcm(data, cluster _ n, options) 

函数 FCM 为 采用 模糊 K-25 (Sy Bh ATS TEF. 

56. function U = initfem (cluster, n, data, n) 

函数 INITFCM 产生 模糊 K-H5 08 RE HE B ЖИЙ Bo EE TES 

57. function [U _ new, center, obj _ fcn] = stepfom(data, U, cluster n, expo) 

函数 STEPFCM 为 模糊 K- 均 值 育 类 方法 中 迭代 一 步 计算 于 程序 。 

58. function out = distfcm(center, data) 

函数 DISTFCM 可 用 于 模糊 K- 均 值 聚 类 方法 中 计算 数据 矩阵 中 样本 点 到 类 中 心 的 欧 氏 
(Euclidean) BR. 

59. function [timeseri.y]=Rung _ kuta(x0,time _ range stepwise); 

ЮК Rung _ kuta ЖЩ Runge-Kutta 法 ; 

60. function [timeseri,y]—=Adambm(x0,time | range.stepwise) ; 

函数 Adambm 为 求解 为 常 微分 组 的 初 值 问题 的 Adams ИН 校正 方法 ; 

61. function [timeseri,y]=:Hamming(x0,time _ range ,stepwise); 


函数 Hamming 为 求解 为 常 微分 组 的 初 值 问题 的 Hamming 定 步 长 方法 ; 


476 


62. function f=dery(y) 

函数 dery 为 定义 一 个 常 微分 方程 组 的 调用 函数 。 

53. function [tout ,yout,03,04,05,06] = ode45(odefile ,tspan,y0, options, varargin 

函数 ODE45 为 解决 非 刚性 常 微分 方程 的 初 值 问题 的 通用 程序 。 

64. function [tout,yout,03,04,05,06] = odel5s Codefile .tspan, y0 , options .varargin) 

函数 ODE15S 为 解决 刚性 常 微分 方程 的 初 值 问题 的 通用 程序 。 

65. function a = appeoef(e,l,arg3,arg4 ,arg5) 

pit APPCOEF 用 于 计算 一 维 信 号 的 逼近 系数 。 

66. function F = coifwavf(wname) 

函数 COIFWAVF 用 于 计算 Coiflets 小 波 滤波 器 . 

67. function w = dbaux(N.sumw); 

pad DBAUX 用 于 计算 Daubechies 小 波 滤波 器 

68. function F = dbwavf(wname) 

函数 DBWAVF 用 于 计算 Daubechies “yak ЖЕ. 

69. function [thr,sorh ,keepapp crit] = ddenemp(dorc. worwp ,x) 

Eğ DDENCMP HIT TE TER ok FAR И EL. 

70. function d = deteoef(c,l,n) 

函数 DETCOEF 用 于 计算 一 维 信号 的 细节 系数 《detail coefficients). 

71. function [a,d] = dwt(x,arg2,arg3) 

函数 DWT 用 于 单 水 平一 维 小 波 变 换 。 

72. function [a,d] = dwtper(x ,arg2,arg3) 

函数 DWTPER 用 于 计算 单 水 平 离散 一 维 小 波 变 换 (周期 性 的 )(periodized》. 

73. function y = dyaddown(x,arg2,arg3) 

函数 DYADDOWN 计算 二 分 的 下 采样 《Dyadic downsampling) 

74. function у = dyadup(x,arg2,arg3) 

函数 DYADUP 计算 二 分 的 上 采样 (Dyadic upsampling)， 它 通过 简单 填 零 而 使 该 过 程 在 
小 波 重 构 算法 中 非常 有 用 。 

75. function x = idwt(a,d,arg3,arg4,arg5) 

函数 IDWT 计算 单 水 平 逆 离 散 一 维 小 波 变 换 。 它 根据 不 同 小 波 基 函 数 Cwname', 参见 
WFILTERS)， 执 行 单 水 平 逆 离散 一 维 小 波 重 构 (reconstruction) 

76. function x = idwtper(a,d,arg3,arg4 ,arg5) 

用 于 计算 单 水 平 离散 一 维 小 波 变换 (周期 性 的 )(periodized). 

函数 IDWTPER 用 于 计算 单 水 平 逆 离 敬一 维 小 波 变换 (周期 性 的 ) (periodized). 

77. function thr = thrwdald(c.1,tptr,scal,n) 

函数 THRWDAD 用 小 波 变换 计算 一 维 自动 去 噪 的 阔 值 。 

78. function thr = thselect(x,tptr) 

函数 THSELECT Wy Jg Fie 38 БН. 

79. function у = upcoef(o,x,arg3,arg4,arg5,arg6) 

函数 UPCOEF 可 用 于 用 一 维 小 波 系数 来 直接 重 构 分 析 信 号 。 


80. function [c,l,a] = upwlev(c,l,arg3,arg4) 


函数 UPWLEV 用 于 一 维 信号 小 波 分 解 的 单 水 平 重 构 。 

81. function [с,1] = wavedec(x;n.arg3.arg4? 

函数 WAVEDEC 可 用 于 计算 多 水 平一 维 小 波 分 解 ， 它 通过 或 是 小 波 基 函数 或 是 小 波 分 
MERRER КОР — ENERE 

82. function thr = wdcbm(c,1,alpha m) 

函数 WDCBM 用 Birge-Massart 策略 对 一 维 分 析 信号 去 品 和 压缩 

83，fLnetion [xd,cxd,lxd] — wden(in],in2,in3,in4,in5,in6.in7) 

函数 WDEN 用 小 波 来 自动 对 一 维 分 析 信号 进行 去 噪 。 

84. function [xc,exc.lxe,perf0,perfl2] =- 

wdencmptoyin2,in3 ,in4 ,in5, in6,in7 ,in8) 

函数 WDENCMP n] f FJ Bade НИК AE. CII- ER BOR ER БШ 
和 和 压缩 。 

85. function [outl,out2,out3,out4,out5,out6,out7,out8] = wfilters(wname,o) 

函数 МЕП ТЕК 计算 小 波 滤 波 器 (Wavelet filters). 

86. function у = wkeep(x,arg2,arg3) 

函数 WKEEP 可 用 于 保存 一 个 矢量 或 一 个 矩阵 的 一 部 分 。 

87. function [x,xn] = wnoise(num,n,snrat,init) 

函数 WNOISE 可 用 于 产生 一 个 含 噪声 的 小 波 去 噪 的 检测 矢量 。 

88. function stde = wnoisest(c,l,s) 

函数 WNOISEST 可 用 于 估计 一 维 小 波 系 数 矢 量 的 噪声 , 

89. function x = wreoef(o,c,l.arg4,arg5,arg6) 

函数 WRCOEF 用 于 从 一 维 小 波 分 解 结构 CC 和 工 )， 或 特定 小 波 基 函数 Cwname'), 8 
特定 重 构 滤 波 器 (Lo R and Hi. R) ТЕШЕ КЕНЕ. 

90. function m = wrmcoef(o,c,l,arg4 ,arg5 ,arg6) 

函数 WRMCOEF 用 于 从 一 维 小 波 分 解 结构 得 到 重 构 系 数 矢量 年 阵 ， 

91. function y = wthresh(x,sorh,t) 

函数 WTHRESH 执行 软 (soft) RIE (hard) WAE. 

92. function [al,a2,a3] = simuff(p,w1,b1,f1,w2,h2,f2,w3,b3,f13) 

函数 SIMUFF 用 于 模拟 前 传 网 络 。SIMUFF 函数 最 高 可 模拟 三 层 网 络 。 

93. function [w1,b1,w2,b2,w3.b3] = initff(p.s1.11:52.f2.53, f3) 

函数 INITFF Inititialize 对 三 层 及 以 下 的 前 传 网 络 进行 初始 化 。 

94. function [a,b,c,d,e,f,g,h] = trainbp(ijsk,limnyoypyqyrysvt》 

函数 TRAINBP 用 误差 反 传 来 训练 前 传 网 络 。TRAINBP RRG 8 FH ЖИЙ OX VI A 
三 层 前 传 网 络 。 

95. function [a,b,c.d,e,f,g.h] = trainbpx(,j. kl m.n.o,p,q,r.s,O 

函数 TRAINBPX 采用 快速 误差 反 传 来 训练 前 传 网 络 , 可 以 训练 一 层 、 二 层 , 最 高 可 以 训 
练 到 三 层 网 络 。 

96. function [a,b,c,d,e,f,g,hJ = trainbpm(ij ,lmvnvop,qyrys:t) 

函数 TRAINBPM 采用 误差 反 传 加 惯量 常数 来 训练 前 传 网 络 ， 可 以 训练 一 层 、 二 层 ， 最 
高 可 以 训练 到 三 层 网 络 。 
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97. function [a,b,c,d,e,f,g,h ] = trainlmG,j kl m. n.o, pias rs, 

函数 TRAINLM 采用 Levenberg- Marquardt 方法 来 训练 前 传 网 络 , 可 以 训练 一 层 、 二 层 ， 
最 高 可 以 训练 到 三 层 网 络 。 

98. function n = purelin(n,b> 

函数 PURELIN 为 线性 转换 或 称 活性 函数 . 

99. function a = tansig(n,b) 

函数 TANSIG 为 双 曲 线 正弦 S 形 转换 或 称 活性 函数 ， 

100. function a = logsig(n,b? 

ЖК LOGSIG 为 对 数 S 形 (sigmoid) 转换 函数 。 

101. function d = deltalin(a,d,w) 

函数 DELTALIN PURELIN 神经 元 的 Delta 函数 。 

102. function d = deltatan(a.d,w) 

函数 DELTATAN TANSIG 神经 元 的 Delta 函数 . 

103, function d = deltalog(a;d.w) 

函数 DELTALOG LOGSIG 神经 元 的 Delta 函数 。 

104. function [dw,db] = learnbp(p.d,lr) 

函数 LEARNBP 为 误差 反 传 学 习 规则 函数 。 

105. function [dw,db] — learnbm (p.d lr mc dw db) 

函数 LEARNBPM 为 含有 惯量 因子 的 误差 反 传 学 习 规则 函数 。 

106. function j = learnlm(p.d) 

函数 LEARNLM X Levenberg-Marquardt 学 习 规 则 函数 。 

107. function m = errsurf(p,t,wv,bv sf) 

函数 ERRSURF 为 误差 表面 函数 . 

108. function plotes(wv.bv,es.v) 

函数 PLOTES 为 误差 表面 作 图 函数 。 

109. function hh = plotep(w,b,e,h) 

函数 PLOTEP 为 权重 和 偏 置 在 误差 表面 位 置 作 图 出 数 。 

110. function [wlvbl'i'trj = tbp1(wi,bl.fl,p,tstp, wv bv.es v) 

函数 TBP1 用 于 训练 一 层 前 传 误差 反 传 网 络 。 

111. function [w1,b1 ,w2,b2,i,t]— tbp2(w1,bl1,flow2 »b2, £2, p. ttp) 

函数 TBP2 用 于 训练 二 层 前 传 误 差 反 传 网 络 。 

112. function [w1;bl,w2,b2,w3,b3 sistr] = tbp3Cwl,bl.fl ,w2,b2,f2,w3,.b3.13,p.t, 


tp) 


BR TBP3 用 子 训练 三 层 前 传 误差 反 传 网 络 

113. function [wl,bl,i,tr] = tbpx1(w1,b1,f1,p,t tp) 

函数 TBPX1 用 于 训练 一 层 网 络 的 快速 误差 反 传 方法 。 

114. function [wl,bl,w2,b2,i,tr] = tbpx2(w1 .b1.f1.w2,b2,f2.p,t tp) 

AR TBPX2 用 于 训练 二 层 网 络 的 快速 误差 反 传 方法 。 

115. function [w1,b1,w2,b2,w3,b3 i, tr] tbpx3 wl bl £1, w2,b2, 12, w3 b3, f pot. 


tp? 


tp) 
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函数 TBPX3 用 于 训练 三 层 网 络 的 快速 误差 反 传 方法 。 

116. function [w1,b1,i,tr] = tlm1(w1,b1,fl,p,t tp) 

函数 TLM1 训练 一 层 前 传 误差 反 传 网 络 的 Levenberg-Marquardt 方法 . 

117. function [w1,b1,w2,b2,i,tr] = tlm2(w1,bl,fl,w2,b2.f2.p,t,tp) 

函数 TLM2 采用 Levenberg-Marquardt 方法 ， 用 于 训练 二 层 前 传 误差 反 传 网 络 。 

118. function [w1,b1,w2,b2,w3,b3,i,tr] = tlm3(w1.b1.f1.w2,b2,f2,w3.b3 ,{3.р,т, 


函数 TLM3 采用 Levenberg-Marquardt 方法 ， 用 于 训练 三 层 前 向 误差 反 传 网 络 。 
119. function Imsobj=!msobj(c,x.y) + 


函数 Imsobj 为 最 小 方差 中 位 数目 标 函 数 子 程序 ， 为 函数 sntopu 调用 子 程序 。 


第 十 四 章 MATLAB REF 


MATLAB 语言 在 进行 矩阵 运算 方面 ， 显 得 特 草 简 捷 、 高 效 和 方便 . 在 化 学 计量 学 的 研究 


和 应 用 中 ， 


很 快 成 为 其 研究 的 主要 工具 ， 目 前 国际 ] 


Chemometris” &I "Chemometrics and Intelligent 
绍 ,使 其 几乎 成 为 进行 化 学 计量 学 研究 的 特定 二 
新 , 其 
动 控制 
特殊 函数 和 图 形 等 领域 ， 表 现 出 一 般 计算 机 高 


功能 越 来 越 强 , 使 之 在 诸如 一 般 数值 计算 、 
ЖЮ. FARSER, REB. ALH 


于 大 都 是 进行 多 变量 运算 ,矢量 和 和 矩阵 是 基本 运算 单元 , MA, MATLAB 诺言 


上 两 本 化 学 计量 学 专业 杂志 ,“Journal of 
Laboratory Systems” 多 次 对 其 进行 了 专门 的 介 
} 算 机 编程 语言 . 随 着 MATLAB 版 本 的 不 断 更 
化 学 计量 学 、 数 字 信 号 处 理 、 系 统 识别 、 自 
经 网 络 、 动 态 仿真 系统 、 小 波 分 析 、 
级 语言 难以 比拟 的 优势 。 所 以 ， 本 书 所 给 出 的 


计算 机 程序 一 般 都 是 MATLAB 语言 的 程序 ， 


中 特别 是 有 关 人 工 神经 网 络 和 小 波 变换 部 分 、 


大 都 是 从 MATIAB 软件 包 (S. 1 版 本 ) 的 工具 库 中 真 接 得 到 , 在 给 出 一 些 基本 程序 的 基础 上 ， 


' 还 给 出 了 一 些 怎样 在 计算 机 上 进行 练习 和 使 有 
实验 室 编 出 ， 并 在 计算 机 上 多 次 使 用 通过 。 对 
出 了 必要 的 说 明 。 对 于 所 列 计算 机 程序 ， 我 人 


的 说 明 。 其 余 有 关 一 些 别 的 程序 ， 大 部 分 是 本 
于 使 用 这 些 程序 的 方法 及 输入 与 输出 变量 也 给 
也 尽量 给 出 其 调用 时 所 需 的 函数 子 程序 ， 但 对 


于 一 些 MATLAB 语言 的 最 基本 函数 子 程序 ， 建 议 读者 参阅 相关 的 专门 介绍 MATLAB ifr 
的 书籍 。 
本 书 给 出 的 MATLAB 语言 计算 机 程序 ,一般 是 按 章 节 编 排 先 后 给 出 的 。 当然, 有 些 程序 
可 在 几 个 不 同 章节 中 使 用 。 对 于 这 一 点 ， 在 本 附录 就 没 特别 说 明了 。 
1. function p = anoval(x,group) 
函数 ANOVA1 可 用 于 一 维 数据 的 方差 分 析 Canalysis of variance). 主要 用 于 比较 2 或 2 组 数据 以 上 的 均 
， 其 原 假 设 (null hypothesis) 是 这 些 组 数据 的 均值 是 相等 的 。 
【例子 】 
G) P = ANOVA1OO 
其 中 输入 参数 X 为 一 数据 矩阵 , 其 每 一 列 视 为 一 组 数据 。 此 程序 过 用 下 平衡 方差 分 析 , 即 每 组 数据 量 相 
等 的 情况 。 
输出 参数 P 为 检验 原 假设 计算 所 得 的 值 。 
(2) P = ANOVA1(X,GROUP) 
其 中 输入 参数 X 在 此 必须 为 一 矢量 , 而 另 一 失 量 参数 GROUP MARERE X 中 数据 的 元 素 相对 应 属 
于 哪 一 组 ， 这样 ， 每 给 的 数据 量 就 没有 数目 必须 相等 的 眼 制 了 。 
输出 参数 P 意义 同 前 。 
BIF ANOVAI 还 同时 给 出 两 个 图 : -" 个 图 给 出 标准 的 一 维 方 差分 析 表 : 另 一 个 图 给 出 形象 表示 各 组 数 
据 均值 及 方差 大 小 的 箱 图 (boxplot). 
参考 文献 : 


Robert V. Hogg, and Johannes Ledolter. Engineering Statistics, Macmillan 1987 рр. 205~~ 206 
【程序 】 
if nargin == 2 
Ix — length (x)+ 
if Ix ~= prod(size(x)) 


error ( Requires a vector first argument. ' ) 


end 


li = length (group); 
ifli == lx 
error ( The inputs must be the same length. °); 


end 


if any (group) < 1 | any(floor(group)) ~= group 
error( The second argument must be a positive integer. + 
end 


group 一 group(:); 
maxi = max(group? ; 
xm = zeros (1 maxi): 
counts = xm: 

for j = limaxi 


k- fmd(group == Ds 


ifj == 1 
M = x(k) 
else 


[r, c] = size(M); 
Ik = length (К); 
if Ik >r 
tmp = NaN; 
M 1k, 2 = tmplones(lk— r,e) ); 
tmp = x(k); 


M == [M imp]: 
else 
tmp = x(k); 


tmpl = NaN; 
tmp((lk + 1):x,1) = rmpl(ones(r—Ik.1)); 
M = [M tmp]; 
end 
end 


countx(j) = length(k); 


хтб) = mesn(x (2; % column means 
end 
‚яш = mean(x) M grand mean 
dfl = maxi- 1; % Column degrees of freedom 
df? = ix— maxi; % Error degrees of freedom 


RSS = countx . * (кт вт) * (xm—gm)! ; % Regression Sum 


of Squares 
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end 
if nargin = = 1 

[т.с] = size(x); 

xm = mean(x); % column means 

gm = mean(xm), % grand mean 

ай = c-l У Column degrees of freedom 

df? = ca (r-- 1); % Error degrees of freedom 

RSS — -* (xm — gm) * (ктт) а У Regression Sum of Squares 
end 
TSS = (х{:) — gm * (x(;) — gm); Ж Total Sum of Squares 
SSE = TSS — RSS; % Error Sum of Squares 


if (SSE~ ==0) 
F = (RSS/df1) / (SSE/df2); 


P = 1 — fedf (F ,df1,df2); K Probability of F given equal means. 
elseif (RSS= =0) % Constant Matrix case, 
F=0; 
p= 1: 
else И Perfect fit case. 
F = Inf: 
р = 0; 
end 
Table = zeros (3,4) HFormatting for ANOVA Table printout 


Table(;.1)—( RSS SSE TSSJ'; 
Table(:,2) 一 [dfl df2 df1--df2]' ; 
Table(; ,3)=[ RSS/df1 SSE/df2 Inf T, 
Table(:,4)=[ F Inf Inf Ys 


figl = figore('pos', [50 350 500 300]); 
set(gca ,' Visible’ ,'off'); 


#0 = 0.00; 

y0 = 0.85; 

dz = 0.15; 

dy =0. 06; 

text(z0+0. 40,y0, ANOVA Table’) 

z—z0--dz; 

y=y0—3*dy/2; 

colheads 一 [Source !;' 55',' 47; MS',’ F 


for i=1:5 
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text(z,y,colheads(i,,)) 


z=z dz 


end 
rowheads = [Columns — ';' Error “Total J 
fori—1:3 

y = у0— (i 1,5) * dy; 

z= zü — dz; 


h = text(z,y,rowheads(is:))5 


zou dz; 

for j=1:4 

if (Table, ~= Inf) & j ~ 
h = text(z,yssprintf 9411. 4g! TableGi 5): 


elseif j 
z = z+ dii 
h = text(zyyysprintf( 967. 5g’ -TableCi.j))); 


z r S¥dz/4; 


fig? = figure(’ pos' ,get(gcf ,'pos') + [0, 一 200,0,0]); 


if nargin = = 1 
boxplot(x.1): 
else 
boxplot (M41) 
h = get(gca, XLabel'); 
set Ch, String "Group Number"); 
end 
2. function [h.sig.ci] = ttest(x,m,alpha, tail) 
BM TTEST 主要 用 于 将 样本 均 秆 与 一 常数 进行 统计 比较 检验 。 
【例子 了 
[H,SIG1 = TTEST(X,M.ALPHA,TAIL) 
对 一 个 服从 正 态 分 布 的 随机 变量 执行 均值 检验 。 
BASE: 
服从 正 夸 分 布 的 随机 变量 量 测 值 ; 
M 为 假设 常数 ; 
ALPHA 为 显著 性 水 平 (significance level) BY; 
TAIL 为 检验 选择 参数 ， 当 TAIL 一 0 时 ,表示 当先 假设 为 “均值 等 于 М” ОХЛЮВ). 当 了 AIL 一 1 时 ， 
表示 备 选 假设 为 “均值 大 于 M”( 单 边 检验 ); 
当 ТАП 1 时 ， 表 示 备 选 假设 为 “均值 小 于 M”( 单 边 检验 ); 
M = 0, ALPHA = 0.05 和 TAIL = 0 X BUE. 
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输出 参数 : 

SIG 为 原 假设 对 被 检验 数据 而 言 其 为 真 的 概率 ; 

H 为 结果 参数 ， 当 HH 一 0 时 ,表示 在 给 定 的 显著 性 水 平 Г.Ж RRR: DS H 一 1 В], RAE ERD 
Ж ЖҮКЕ E MB. | of alpha." 

参考 文献 ， 

E. Kreyszig, “Introductory Mathematical Statistics”, John Wiley. 1970. page 206 

【程序 】 
if nargin < 1, 

error ( Requires at least one input argument. ') ; 


end 


fmi n1] - size(x)s 
if Gal ~= Leal ~= 1) 
error(’Requites a vector first input argument. '); 


end 


if nargin < 2 


if nargin <4, 
tail = 0; 

end 

if nargin < 3, 
alpha = 0.05; 


end 


if (alpha < = 0 | alpha >= 1) 


fprintf Warning, significance level must be between 0 and 1\n')s 


h = NaN; 
sig = NaN; 
ci = [NaN NaN; 
return; 
end 


samplesize = length); 
xmean = mean(x); 

ser = std(x) . ‘sqrt (samplesize) ; 
tval = (xmean — m) / ser; 


sig = tcdf(tval.samplesize — 1); 


% the significance just found is for the tail = —1 test 
crit = tinv(1 — alphassamplesize — 1). * seri 
if tail == 


sig = 1 — sig; 
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elseif tail + - 0 

sig — 2* minCGsig,1 — sig); 

crit = tins (1. - alpha / 2)ysamplesize — 1). * ser; 
end 


ci — [xmean 一 crit) (xmean + crit]; 


X Determine if the actual significance uxceeds the desired significance 


h = 0; 


if sig <= a pha, 


h 


end 


if isnan (sig), 
h = NaN; 
end 

3. function [h, significance, ci] = ttest2(x,y ;alpha tail) 

AM EST? 主要 用 于 将 某 样本 均值 与 另 一 样本 均值 进行 统计 比较 恰 验 。 

【例子 】 

[H,SIGNIFICANCE CI] = TTEST2(X,Y,ALPHA, TAH.) 

对 两 个 服从 正 态 分 布 的 随机 变量 执行 均值 检验 。 

MASK: 

X ARIES 1 ФЕ LE ЖИИ; 

M 为 很 设 常数 ， 

ALPHA 4 {ЕЖЕ (significance level) BK; 

TAL 为 检验 选择 参数 ， 当 TAIL “0 时， 表示 备 选 假设 为 “随机 变量 X KREFTENE Y” (ХОЛ 
检验 ); 当 TAIL 一 1 时 ,表示 备 选 假设 为 “随机 变 其 X AT OLE Y" CAL >, 当 TAIL- 一 1 时 ， 
表示 备 选 候 设 为 “随机 变量 X 的 均值 小 于 随机 变量 Y”( 单 边 检验 ); 

M = 0. ALPHA ~ 0.05 Я TAIL = 0 WHE. 

输出 参数 ， 

SIGNIFICANCE 为 原 假设 对 被 检 验 数 据 而 言 其 为 真 的 概率 

H ARREN., 当 H=0 时 ,表示 在 给 定 的 显著 性 水 平 上 不 拒绝 原 假设 ; 而 5 H—1 时 ,表示 在 给 定 的 
显著 性 水 单 上 拒绝 原 假设 

参考 文献 

E. Kroyssig, "Introductory Mathernatice] Statistics", John Wiley. 1970. section 13.4. (Table 13. 4. 1 on page 210) 

[RF] 
if nargin < 2, 

error Requires at least two input arguments ); 


end 


[ml nl? = size(x)s 

[m2 n2] = cizety)s 

if (ml ~= L&nl~=1) ! (m ~= 1& n2 —= 1) 
error Req ares vector first and second inputs, ; 


end 
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if nargin < 4, 
tail = 0; 


end 


if nargin < 3, 
alpha — 0. 05; 


end 


if (alpha <= 9 | alpha >= 1) 
Íprintf( Warning: significance level must be between 0 and 1\n‘)+ 
h = NaN; 


sig = NaN, 
return; 
end 


dfx = length(x) — 1; 
diy = length(y) — 1; 
dfe = dix + diy; 

mex = dfx * var(x); 


msy = Фу x var(y)s 


difference = mean(x) — mean(y); 


pooleds = sqrti(msx + msy)x (1/(dfx + 1) + 1/(diy + 1)) / dfe); 


ratio = difference / pooleds; 


criticalvalue — tinv(1 — alpha / 2,dfe); 


spread = criticalvalue * pooleds; 


ci = [(difference — spread) (difference + spread) J; 


и Find the significance probability for the tail = 1 test. 
significance = | — tedf(ratio,dfe); 
% Adjust the significance probability for other null hypotheses. 
if tail == 一 1 

significance == 1 — significance; 
elseif tail == > 

significance = 2# min(significance,1 — significance); 


end 


$ Determine if the actual significance exceeds the desited significance 
h 0; 


if significance <<= alpha, 
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h= 1; 


end 


if isnan (significance), 


= NaN; 
end 

4. function x = ffZn(n) 

函数 FF2N 用 于 构建 两 水 平 全 因 于 设计 表 。X 一 FF2N(N ) 给 出 具有 N AMR EE X, 其 中 输入 
参数 N 为 基于 数 。 


【程序 ] 
rows = 2.7 (n); 
nicycles = rows; 


group = zeros(rowssn); 


fork = ln 
settings =: (0:1): 
ncycles = neycles/2s 
nreps = rows. /(2 * ncycles); 


settings =: settings(ones(l ,nreps) , :); 


settings == settings(;); 
settings == settings(: ,ones(1 ,neycles)); 
x(G m—k+1) = settings(:): 
end 
5. function design = fullfact (levels) 
函数 FULLPACT 用 于 混合 水 平 (Mixed-leveb) HOB FRE. MAKRAMA LEVELS 用 于 定义 每 
列 的 水 平 数 ， 如, LEVELS = [2 4 35, 函数 FULLFACT 将 给 出 -个 进行 24 IK bist SB ES РЕЯ. 其 
中 第 一 列 是 2 水平 ! 第 二 列 是 4 水 平 ; 第 三 列 是 3 水 站 的 设计 。 
【程序 】 


[m;n] = size(levels); 


if min(m,n) ~= 1 
error (Requires a vector input. 2 


end 


if any ( (floor (levels) — levels) ~= 0) | any(levels <= 1) 
еггог The input values must be integers greater than one. 2 


end 
ssize — prod (levels); 
ncycles = ssize; 


cols = max(üm,n); 


design = zeros(ssize cols) s 
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for k = 1:cols 
settings= (1;;evels(k)); 
ncycles = ncycles. /levels(k); 
nreps -- ssize. /(neycles я levels(k)) + 
settings = ѕе tings (ones(] snreps) s+); 
settings = settings(:); 
settings = seitings (; ones 1 sncycles)) s 
design(: sk) == settings(:); 
end 
6. function [settings, X] = cordexch(nfactors, nruns model) 
ih CORDEXCH 用 坐标 交换 (coordinate exchange) 数 值 方法 给 出 |)- 最 优 设计 表 。 
【例子 】 
LSETTINGS, X] -- CORDEXCH(NFACTORS,NRUNS, MODEL) 
输入 参数 ， 
NFACTORS 表示 试验 的 因子 数 ， 
NRUNS 表示 想 要 进行 试验 的 次 数 ; 
FARSE MODEL 表示 所 选择 的 回归 模型 ， 其 预 置 值 为 个 包括 常数 项 的 线性 加 合 模型 ; 
当 MODEL--'interaction 时 ， 表 示 一 个 包括 常数 项 ， 线 性 项 和 交叉 项 的 回归 模型 ， 
'quadratic 时 ， 表 示 一 个 包括 常数 项 、 线 性 项 、 交 叉 项 以 及 平方 项 的 回归 模型 ， 
purequadratic 时 ， 表 示 一 个 包括 常数 项 、 线 性 项 、 和 平方 项 的 回归 模型 ， 


输出 参数 : 

SETTINGS 为 一 因子 设置 矩阵 ， 

X 为 相应 的 设计 和 矩阵。 

【程序 】 

settings = unifrnd(—1,1,nruns,nfaetors); 
一 2 


if nargin 
model 


end 


"linear! s 


if ~ isstr model 
if nfactors — = size(model, 25 
error ("The number of columns іп a numeric model matrix must equal the number of factors. "); 


end 
axij = linspace(-- 1,1,max(model())-- D; 
пхй = C—1:1); 

X = xix settings model) ; 

if size(X,2) > size(X,1) 


error ("There are not enough runs to fit the specified model.') ; 


end 


[О.К =ш(Х.0); 
logdetX = 7 * sum(log(absCdiag(R)))); 


maxiter = 10; 


iter = 0; 


madeswitch == 1; 


% Create Iteration Counter Figure. 


screen = get(0,’ScreenSize’ ) 5 


f = figure Units! ‘Pixels’ , ‘Position’ , [25 screen (4)—150 300 60]... 


"Color [0.5 0.50.5]: 
ax = gea; 
set(ax ,' Visible’ soff); 
t—text (0,0. 7,' Coordinate exchange iteration counter’); 


set(t,' FontName' ,'Geneva' ,'FontSize' 12): 


while madeswitch > 0 & iter < maxiter 
madeswitch = 0; 


iter = iter + 15 


% Update iteration counter, 

s= sprint! (Iteration 264i" siter); 
set(f,’CurrentAxes’ ax); 

h=text(),0. 2,8): 

set (h,/FontName’ Geneva” ‚FontSize .12) 5 


drawnow 


MX, Loop over rows of factor settings matrix. 
for row == l;nruns 
34 Loop over columns of factor settings matrix. 
for col = 1;nfactors 
fx == x2fx(settings(row, :) model); 
xij -= settings(row. col); 
xnew = settings(rows:)} 
xnew = xnew(ones length(nxij) D 2; 
xnew(;,coD = nxijy 
fxnew = x2fx(xnew model); 
% Compute change in determinant. 
fxold = fx (ones (length (nxij).1)5:)+ 
Е = fxold/R; 
F = fxnew/R; 
dxoid = sum((E. ж E)’)'s 
dxnew = sum((F. ж F), 


dxno = sum((E. * F)!)’s 
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d = (1 — dxnew). + (1 — dxold» + dxno. ^ 2; 


% Find the maximum change in the determinant. 
[d.idx] = maxtd5; 
% Switch coordinates if the maximum change is greater than 1. 
ifd 2 1, 
madeswitch = 1; 
logdetX = log(d) + logdetX ; 
settings (row, 1) = xnew(idx, :); 
X(row,:) = fxnew(idx, 2; 


[Q,R] = ar(X,0); 


end 
end 
end 

delete(h); 

end 

close(D ; 
7. function [settings, X] = daugment(startdes nruns model? 
函数 DAUGMENT 用 坐标 交换 数值 方法 米 增 加 原 D- 最 优 试 验 设计 的 试验 次 数 
[571 
[SETTINGS, X] ~ DAUGMENT(STARTDES,NRUNS, MODEL > 
MAER: 
NFACTORS 表示 试验 的 因子 数 ; 
NRUNS 表示 想 要 进行 试验 的 次 数 ; 


* BBR MODEL 表示 所 选择 的 回归 模型 ， 其 预 置 值 为 一 个 包 恬 常 数 项 的 线性 加 全 模型; 
当 MODEIL=='interaction’ 时 ， 宪 示 一 个 包括 常数 项 ， 线 性 项 和 交叉 项 的 回归 模型 ; 

当 MODEI. 二 'quadratic' 时 ， 表 示 一 个 包括 常数 项 、 线 性 项 、 交 叉 项 以 及 平方 项 的 回归 模型 ; 
34 MODEL =” purequadratie' 时 ， 表 示 一 个 包括 常数 项 、 线 性 项 、 和 平方 项 的 回 亲 模型 ， 
输出 参数 ， 

SETTINGS 为 一 因子 设置 矩阵 ; 

X 为 相应 的 设计 矩阵 。 

【程序 ] 


[nobs, nfactors- = size (startdes) ; 


settings = unifrnd (—1, 1, nruns, nfactors); 


if nargin 
model = ‘linear! s 


end 


settings — [startdes; settings}; 


X = x2fx (settings, model); 
[Q, К] =ar ‹Х, 0), 
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logdetX = 2*sum Clog (abs (diag (RO): 
info = inv OC * X); 


% Create Iteration Counter Figure. 

screen = get (0, ScreenSize 2; 

Í = figure Units! , Pixels! ,'Position’, [25 sereen (4) 一 150 300 6 
‘Color’, [0.5 0.5 0.5]; 


ax = кат 
set (ax, Visible! off); 
t=text (0, 0.7,'D-optimal design iteration counter) ; 


set (t,'FontName' ,'Geneva' ,'FontSize’, 12); 


maxiter = 10; 


iter = 


madeswitch = 1; 


while madeswitch > 0 & iter < maxiter 
madeswitch = 0: 


iter = iter + 14 


% Update iteration counter. 

s—sprintí. (‘Iteration % 4i, iter); 

set (f.'CurrentAxes', ax), 

h=text (0, 0.2, в); 

set. (h,'FontName' ,'Geneva' ,' FontSize’, 12); 


drawnow ; 


for row := nobs+1: nobs+nruns 
for col = 1: nfactors 
fx == x2fx (settings (row,:), model); 
xij = settings (row, col); 
nxij = (—1: DG 


xnew = settings (row,:); 


xnew 


= xnew (ones (length (mi, D.0; 
xnew (;, col) = nxijy 
Íxnew = x2fx (xnew, model); 


fxold = fx (ones (length (nxij), 1),:25 


% Compute change in determinant. 
Е = fxold/R; 

F = fxnew/R, 

dxold = sum ( (E. x E) 


dxnew = sum ( (Е. +F) Y; 


492 


dxno = sum ( (Е. xF); 


d — (1 + dxnew), ж (1 — dxold) — dxno. 


~ 


26 Find the maximum change in the determinant. 
[ds ida] = max (d); 
Жа > 1. 


madeswitch -~ 1; 

logdetX = log (d) + logdetX s 

settings (row,:) — xnew (idx, :): 

X (row, 

[Q. R] = ac (X, 0); 
end 


end 


fxnew (idx,,); 


end 
delete (h); 
end 
close (D; 
8. function D = x2fx(x,model) 
函数 X2FX 是 一 个 用 于 函数 REGSTATS ,函数 CORDEXCH & Ж RSTOOL 的 调用 函数 , 它 将 执行 将 
-个 系统 输入 夭 阵 转换 到 -- 个 给 定 回归 模 型 的 设计 短 阵 。 
【例子 】 
D = X2FX(X,’MODEL') 
输入 参数 : 
X BRS ARE S 
FARBER MODEL 表示 所 选择 的 回归 模型 ， 其 预 署 值 为 -个 包括 常数 项 的 线性 加 合 模型 ， 
34 MODEL ~'interaction 时， 表示 一 个 包括 常数 项 ， 线 性 项 和 交叉 项 的 回归 模型 ， 
34 MODEL="quadratic' 时， 表示 一 个 包括 常 效 项 、 线 性 项 、 交 叉 项 以 及 平方 项 的 回归 模型; 
当 MODEL 一 "purequadratic 时 ， 表 示 一 个 包括 常数 项 、 线 性 项 ， 和 平方 项 的 回归 模型 ， 
输出 参数 : 
DAM HAMM GS ETE PE. 
参见 RSTOOL， CORDEXCH, ROWEXCH. REGSTATS. 
【程序 了 


[m, п] = size (х); 


if nargin == 1, 
D = [ones (m, 1) x]; 
return, 

end 


if stremp (model, linear) | stremp (model,'1’) | stremp (model 1) |... 
stremp (model,'Linear’) | stremp (model,‘additive') | stremp (módel, Additive’), 


D = [ones (m, D x2; 


elseif stremp (model, interaction) | strcmp (model, quadratic) |... 


stremp (model,'q') | stremp (model,'i') | stremp (model, Interaction”) 1... 
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stremp (model, Quadratic) | stremp (modei, interactions) |... 
strcmp (model,’Interactions’) | stremp (model,'Q') | stromp (modelyT), 
D = [ones (m, D x]; 
for idx = 1: n 
хах = x Gs idx); 
xidx = xidx (;, ones (n—idx, D); 
D = [Dxidx. * x (i, idx+l; 0]: 
end 
if stremp (model ,'quadratic') | strcmp (model,'q') | stremp (model Q’) |... 
stremp (model, Quadratic"), 
D-[Dx *x] 


end 


elseif strcmp (model,'purequadratic’) | stremp (model,'p) |... 
stremp (model,’Purequadratic') | stremp (model,’P"), 


D = [ones (m, D x x. *x]i 


elseif stremp (model, model) | stremp (model, MODEL? 
dlgname = ‘Not a Model’ s 
warningstr = ['Sorry, ' model ' is not a valid string for the model parameter. ']; 
warndlg Gwarningstr, digname): 


elseif isstr (model) 
D = feval (model, x); %Allows for extensions to named higher order models. (е. g. “cubic ) 


elseif —isstr (model) 
(row. col] — size (model); 
if col ~= n 
error СА numeric second argument must have the same number of columns as the first argument. Di 
end 
D = zeros (m, row); 
for idx = 1. row 
carat = model dx, Di 
tmp = x. ^ carat (ones (m, 1),:3; 
1 


if size (tmp, 2) = 
D (.. idx) = tmp; 

else 
D (:, idx) = (prod (tmp'))"s 

end 

end 
end 

9, function [x, options] = fmins(funfen,x options, grad , varargin) 

函数 FMINS AFETAR Je BEC IUS. 

[971 

(1) X = FMINSCF' .X0) 
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输入 参数 : 
F 为 一 字符 串 参 数 , 用 以 表示 目标 函数 ， 
iF = 'exp(x(1))* (Lex(D^ 2 + 2«x(2^ 2 — 4 xx(1)*x(2) + 2*xt2 + 1) 
或 为 一 以 M 文件 表示 的 函数 ,参见 使 用 示例 ; 
XO 为 初始 搜索 坐标 位 置 ; 
输出 参数 : 
X 为 最 终 坐 标 位 置 ， 
(2) [X,OPTIONS] = FMINSCF',X0,OPTIONS,[]J,P1,P2, 5 
输入 参数 
FE 为 一 字符 串 参 数 ,用 以 表示 目标 函数 ;如 : 
Е = 'exp(x(1))* (4x x(1)* 2 + 2*x(2)° 2 + 4*x(1) *x(2) + 2*х(2) + DG 
或 为 一 以 M 文件 表示 的 函数 ,参见 使 用 示例 ; 
X0 为 初始 搜索 坐标 位 置 ; 
OPTIONS 为 最 优化 计算 工具 箱 通 用 选择 参数 ,参见 有 关 它 的 说 明 
P1,P2,…: 为 以 M 文件 表示 的 目标 函数 所 需 调用 的 参数 ， 
输出 参数 ， 
X 为 最 终 坐 标 位 置 ; 
OPTIONS 为 最 优化 计算 工具 箱 通用 选择 参数 ,参见 有 关 它 的 说 明 
说 明 ; 函数 FMINS 采用 Nelder-Mead 的 单纯 形 搜索 优化 法 ， 
参见 FMIN, FOPTIONS. 
参考 文献 : 
J. E. Dennis, Jr. and D. J. Woods, New Computing Environments: Microcomputers in Large-Scale Computing edited by 
A. Wouk, SIAM, 1987, pp. 116~122 
[EF] 
if nargin<3, options = []; end 
options = foptions(options); 
prnt = options(1); 
tol = options(2); 
tol2 = options(3); 
% The input argument grad is there for compatability with FMINU in 
% the Optimization Toolbox, but is not used by this function. 


% Convert to inline function as needed, 
funfen = fenchk Gunfen length (varargin )); 
n = prod(size(x)) + 
if (~~options(14)). 

options(14) = 200 * n; 


end 


% Set up a simplex near the initial guess. 
xin = x(:); % Force xin to be a column vector 
v = xin, % Place input guess in the simplex! (credit L. Pfeffer at Stanford) 


xG) = v; fv = feval(funfon ,x varargin( 12); 


% Following improvement suggested by L. Pfeffer at Stanford 
usual delta = 0. 05; % 5 percent deltas for non-zero terms 
zero term dela = 0.00025; % Even smaller delta for zero elements of x 


for j = l:n 


y = xin; 
Чуб) == 0 
УС) — (1 + usual _ delta) * yG); 
else 
УЧ) = zero. term. delta; 
end 
ve [vy 
x(:) = y; f = feval(funfen.x,varargin{:})+ 
fv = (iz) 
end 
Dvj] = вот): 


v= (рі 


func _evals = n+1; 
if prnt > 0 
cle 
format compact 
format short e 
home 
func _evais 
disp initial ') 
disp 9 


end 


alpha = 1; beta = 1/2; gamma = 2: 
[n,np1 ] = size(v); 

onesn = ones(1,n); 

ot = Z:n+l; 


on = 1:n; 


У Tterate until the diameter of the simplex is less than tol. 
while func _ evals < options(14) 
if max (max (abs(v(: ,ot)—v(; зопевп)))) <= tol 5... 
max(abs(fv(1) —fv(ot))) <= tol2 
break 


end 


% One step of the Nelder-Mead simplex algorithm 
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vbar = (sum(v(:,on)')/n); 
vr = (1 — alpha) * vbar — alpha * v(: 0+1); 
хб) = vr; 
fr = feval(funfcn,x,varargin[:)); 
func _ evals = func evals + 1) 
vk = угу fk = fr; how = ‘reflect ’; 
if fr < fvin) 
if fr < fvCD 
ve = gamma жуг + (1—gamma) x vbar; 
х(:) = vey 
fe = feval(funfcn,x,varargin(:)); 
func, evals = func _ evals + 1; 
if fe < fO) 
vk = ve; fk = fei 
how = ‘expand '; 
end 
end 
else 
vt = vCon DD; ft = fe n+1); 
if fr < ft 
vt = vy ft = fry 
end 
ve = beta * vt + (1—beta) ж vbar; 
x(;) = vo; 
fc = feval(funfen x ,varargin( 125 
func evals = func evals + 1; 
if fe < fv(n) 
vk = ve; fk = fc; 
how = ‘contract’; 
else 
for j = 2in 
70.) = GGD + vG 
xGJ = 0.) 


fv() = feval(funfen sx, varargin{:}); 


2/25 


end 
func  evals = func evals + n—1; 
vk = (у(4,1) + vG n 410/25 
xG) = vk; 
fk = feval(funfen,x ,varargin(: 1: 
func _evals = func _evals + 1; 
how = ‘shrink '; 
end 

end 
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venti) = vk; 
fv(n-+1) == fk; 
[fv,j] = sort(fv)s 


v = vis 


if prnt > ü 
func, evals 
disp (how? 
displ 9 


end 

xG) = уба; 

if prnt > 0, format, end 

options(10) == func | evals; 

options 8) = min (fy) 5 

if func _ evals= =options(14) 

if options(1) >= 0 
disp([’ Warning; Maximum number of function evaluations ( 
intYstrCoptions(14)),") has been exceeded’ J); 
disp (increase OPTIONS(14)). ') 
end 

end 
10. function [x, OPTIONS] = fminu(FUN,x,OPTIONS,GRADFUN ,varargin) 
函数 fminu 通用 局 部 最 优 算法 函数 ,其 预 置 算法 采用 BFGS Quasi-Newton ik. 
【例子 】 
(1) X=FMINU CFUN' ,X0) 
输 人 参数 ， 
FUN 为 一 字符 申 参 数 ,用 以 表示 目标 函数 ,如 : 
FUN = 'ехр(х(1))* (4*x()^ 2 4 2*x02^ 2 + 4*xCO *xCD + 2«x(D + D's 
或 为 一 以 M 文件 表示 的 函数 ,参见 使 用 示例 ; 
XO 为 初始 搜索 坐标 位 置 
输出 参数 ， 
X 为 最 终 坐标 位 置 ; 
(2) [X,OPTIONS]=PMINU(/FUN' ,X0,OPTIONS,'GRADFUN',P1,P2,...) 
输入 参数 ， 
FUN 为 一 字符 中 参数 .用 以 表示 目标 函数 ;如 ， 
FUN= 'expG(1) * 4 *x(D^ 2 + 2*x(2^ 2 + 4*xCO * x(D 十 2xxC2) + Ds 
或 为 一 以 M 文件 表示 的 函数 ,参见 使 用 示例 + 
Xo 为 初始 搜索 坐标 位 置 ， 
OPTIONS 为 最 优化 计算 工具 箱 通用 选择 参数 ,参见 有 关 它 的 说 明 ; 
GRADFUN 为 调用 一 个 名 为 "GRADEUN 的 函数 以 得 到 某 给 定 函数 í RER X 之 上 的 导数 df/dX， 
P1,P2.... ;为 以 M 文 作 表 示 的 目标 函数 所 需 调 用 的 参数 。 
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输出 参数 ， 

X 为 最 终 坐 标 位 置 ; 

OPTIONS 为 最 优化 计算 工具 箱 通用 选择 参数 ,参见 有 关 它 的 说 明 。 

说 明 : 函数 FMINU MERA BFGS Quasi-Newton 法 ,以 一 个 混合 2 阶 和 3 阶 多 项 式 进行 一 维 搜索 过 程 
(line search procedure) , 

【程序 】 
M 一 一 
XOUT=x(:); 
nvars=length (XOUT) s 


--Initialization ----------++s+-- --------------- 


if nargin <2, error C fminu requires two input arguments’ ) end 
if nargin < 3, OPTIONS- []: end 
if nargin < 4, GRADFUN —[]; end 


% Convert to inline function as needed. 
if ~isempty(FUN) 
[funfcn, msg] = fcnchk (FUN ,length (varargin) + 
if ~isernpty (msg) 
errorCmsg 5 
end 
else 
error FUN must be a function name or valid expression. ') 


end 


И ~isempty (GRADFUN) 
[gradfen, msg] 一 fenchk(GRADFUN length (varargin)) , 
if ~~isempty (msg) 
error (msg) ; 
end 
else 
gradfcn = [7]; 


end 


f = feval(funfen x ,varargin( }); 
n = length(XOUT) ; 
GRAD=zeros(nvars 15 
OLDX=XOUT: 

MATX —zerost 3,1) ; 

MATL- [0:9]; 


FIRSTF =f; 
(OLDX ,OLDF HESS, OPTIONS ]=optint(XOUT .f OPTIONS) ; 
CHG = 1e—7 x abs(XOUT) + le—7 * ones(nvars, 1); 


SD = zeros(nvars. 1); 
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diff = zeros(nvars,1); 
PCNT = 0; 


how = " B 


OPTIONS(10)—25 % Function evaluation count (add 1 for last evaluation) 


status 一 一 15 


while status 一 一 1 
% Work Out Gradients 
if isempty(gradfen) | OPTIONS) 
OLDF =f; 
Finite difference perturbation levels 
% First check perturbation level is not less than search direction. 
{ = find(10 x abs(CHG)>abs(SD)); 
CHG(f) = —0.1* SD): 
% Ensure within user-defined limits 


CHG = sign(CHG+eps). ж min (max (abs (CHG) ,OPTIONS(16) } ,OPTIONS(17)) + 


for gent== 1 :nvars 
XOUT (gent, 1) = XOUT (gene) +CHG (gent i 
x(:) = XOUT: 


Í = feval(funfen,x ,varargin( : 12 
GRAD (gent) = (f —OLDF)/(CHG (gent )) 5 
if f < OLDF 
OLDF =f; 
else 
XOUT (gent) =XOUT (gent) — СНО (gent) 5 
end 
end 
M Try to set difference to 1е— 8 for next iteration 
3⁄4 Add eps for machines that can't handle divide by zero. 
CHG = le—8./(GRAD + eps); 
{ = OLDF; 
OPTIONS(10) =OPTIONS (10) +nvars; 
% Gradient check 
if OPTIONS(9} == 1 
GRADED = GRAD; 
x(:)=XOUT: 
КАРС.) = feval(gradfen x »varargin (:1)& 
if isa(gradfen,’ inline’) 
graderr(GRADFD; GRAD, formula (gradícn)) + 
else 
graderr (GRADFD, GRAD, gradfen)s 
end 
OPTIONS(9) = 0; 
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end 


else 
OPTIONS(11)=OPTIONS(11)+1; 
x(:)=XOUT; 
GRAD(,) = feval(gradfcn,x,varargin(;)); 


------Initialization of Search Direction-— 


if status -1 
SD— —GRAD; 
FIRSTF=f; 


OLDG=GRAD; 
GDOLD=GRAD’ * SD; 

% For initial step-size guess assume the minimum is at zero. 
OPTIONS(18) = max(0. 001, min([1,2 * abs (f/GDOLD) ); 
if OPTIONSCD 770 


disp (Lsprintf ('%5. Of %12. 6g %12. 6g ' OPTIONS (10), f, OPTIONS (182, sprintf C %12- 3g ' 
GDOLD)]); 


end 
XOUT=XOUT+OPTIONS(18) * SD; 
status 4; 


if OPTIONS(7) = —0; PCNT=1, end 


hrection Update----. 
RAD! * SD; 
if OPTIONS(1)>0, 


gdnew 


num = [sprintf (965. 0f %12. 6g %12, 6g ', OPTIONS (10) , f, OPTIONS (182) , sprintf C 9612. 3g, 
gdnew)]; 


end 
if (gdnew>-0 & £>FIRSTF) | ~finite (£) 
% Case 1: New function is bigger than last and gradient w. r.t. SD -ve 
% - . interpolate. 
how = "inter' ; 
[stepsize , —cubicil (f, FIRSTF »gdnew ,GDOLD ,OPTIONS(18)); 
И stepsize<0 |isnan (stepsize) , stepsize OPTIONS(18)/2: how='C1f '; end 
if OPTIONS(18) <0. 1&OPTIONSCO = =0 
if stepsize * norm(SD)<eps 
stepsize =exp(rand(1,1)~1)—0.1; 
how—'RANDOM STEPLENG TH’; 
status—0, 
else 
stepsize —stepsize/2; 
end 


end 
OPTIONSC18)=stepsize; 
XOUT=0LDX; 
elseif {< FIRSTF 
[newstep,fbest] 一 cubici3([,FIRSTF ,gdnew,GDOLD,OPTIONS(18))， 
sk=(XOUT-OLDX)’ * (GRAD-OLDG); 
if sk>-le—20 
% Case 2: New function less than old fun. and OK for updating HESS 
. update and calculate new direction. 


if gdnew-co 
how 'inestep' у 
И newstep<OPTIONS(18), newstep—2 x OPTIONS(18) + le—5; 
how= (how, IF']; 
end 
OPTIONS(G8) —min [max (2.1. 5 + OPTIONS (18) J) , 1 +sk J-abs(gdnew) J-max (0, OPTIONS 
0182—10, 1. 2+0. 3 * (~OPTIONS(7))) * abs(newstep? D; 
else % gdnew>0 
if OPTIONS(18)>0. 9 
how-—'int st'; 
OPTIONS(8) —min([1.abs(newstep) j); 
end 
end %if gdnew 
(HESS, SD]=updhess(XOUT ,OLDX .GRAD,OLDG , ESS OPTIONS) ; 
gdnew=GRAD' x SD; 
ОГОХ = XOUT: 
status=4; 
M Save Variables for next update 
FIRSTF =f; 
OLDG— GRAD; 
GDOLD- gdnew ; 
% YE mixed interpolation set PENT 
if OPTIONS(7 0, PCNT—1; MATX=zeros(3,1); MATL(1)=f; end 
elseif gdnewZ»0 %sk< = 0 
M Case 3: No good for updating HESSIAN . interpolate or halve step length. 
how-'inter st’; 
if OPTIONS(18)>0. 01 
OPTIONS(18)=0. 9 * newstep; 
XOUT=OLDX; 
end 
if OPTIONS(18)>1, OPTIONS(18)= 1; end 


else 


И Increase step, replace starting point 


OPTIONS(18) =max([min(Lnewstep-OPTIONS(18) 3) ,0. 5 * OPTIONS(18) ]1; 
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how = incst2! 5 
OLDX=XOUT; 
FIRSTF=f; 
OLDG=GRAD; 
GDOLD-GRAD' * SD; 
OLDX—XOUT; 
end % ii sk> 
% Case 4; New function bigger than old but gradient in on 
% -..teduce step length. 
else %gdnew<0 & F>FIRSTF 
И gdnew OE FIRSTF 
how—'red уер! 
if norm(GRAD—OLDG)<le— 10; HESS —eye(nvars) end 
if abs (OPTIONS (18}) «eps 
SD = norm (avars, 1) * (rand(nvars,1) — 0. 5); 
OPTIONS(Q8) =abs(rand (1,1) 70.5) * 1e—6: 
how='RANDOM SD' ; 
else 
OPTIONS(Q8) = —OPTIONS(18)/2; 
end 
XOUT-OLDX; 
end %gdnew>0 
end % if “gdnew>0 & F>FIRSTF ) |~finite(F) 
XOUT-XOUT--OPTIONS(18) * SD; 
if isinf COPTIONS(1)) 
disp([numvhow]》 
elseif OPTIONS) 0 
disp(num) 
end 
eud %----------End of Direction Update. 


% Check Termination 
if max(abs(SD))<2 » OPTIONS(2) & (一 GRAD' + SD) < 2 * OPTIONS(3) 
if OPTIONSCD > 0 
disp( Optimization Terminated Successfully ) 
disp( Search direction less than 2 * options 2) 
р Gradient in the search direction less than 2 * options 3) 
dispi NUMBER OF FUNCTION EVALUATIONS-'. 
int2str(OPTIONS(10)9)5 
end 
status=-]; 
elseif OP'TIONS(10)2>OPTIONS(14) 
if OPTIONSCD >= 0 


disp (‘Maximum number of function evaluations exceeded' ) 


disp(' increase options(14).‘) 
end 
status= 1; 


else 


% Line search using mixed polynomial interpolation and extrapolation. 
if PCNT~ =0 
while PONT > 0 & OPTIONS(10) < = OPTIONS(14) 
x(,) = XOUT; 
f = feval(funícn,x,varargin(:)); 
OPTIONS(10)=OPTIONS(10) +1: 
[PCNT,MATL,MATX,steplen,f, 


how ]= searchq(PCNT,{,OLDX,MATIL., MATX ,SD.GDOLD,OPTIONS(18), how); 


OPTIONS(182 =steplen; 
XOUT=OLDX-+tsteplen x SD; 
end 
if OPTIONS(10}>>OPTIONS(14) 
if OPTIONS(1) >= 0 
disp Maximum number of function evaluations exceeded ;") 
disp(' increase options 145. ') 
end 
status=1; 
end 


else 


= ХООТ; 
f = feval(funfcn,x,vararginí:]); 


OPTIONSC10)=OPTIONS(10) +1; 


x( 


end 
end 


end 


x(G)—XOUT; 
f = feval(funfcn;x verargin (12); 
if £ > FIRSTF 
OPTIONS(8) = FIRSTF ; 
x(:) =OLDX; 
else 
OPTIONS(8) = f; 
end 


11. function 


[x OPTIONS, lambda, HESS ]—nlconst (FUNfen , x . OPTIONS, VLB.VUB,GRADIen vara rgin); 


5 
函数 NLCONST 为 下 述 函 数 的 一 个 中 间 育 用 函数 ， 
CONSTR, ATTGOAL. SEMINF 和 MINIMAX, 
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【程序 】 
global OPT _ STOP OPT _STEP; 
OPT _ STEP == 1; 
OPT _STOP == 0; 
% Initialize so if OPT _ STOP these have values 
lambda = [J]; HESS = (J; 


Nlconst = ‘nlconst' ; 


% Set up parameters. 
XOUT=x(.)s 


VLB—VLB(:?; lenvlb= length (VLB); 
VUB=VUB(;); lenvubzlength (VUB) ; 
һев = Inf; 


nvars = length(XOUT)+ 


CHG = 1е—7 * abs(XOUT)-+ 1e —7 * ones(nvars,1); 
if lenvlb * lenvlb>0 
if any(VLB( (1 lenvub)! ) > VUB), error(’Bounds Infeasible’), end 
end 
for i=1:lenvib 
if lenvlb>0,if KOUTG)<VLBG) ,.XOUT() =VLB()+ le— 4; end end 
end 
for i=1,;lenvub 
if lenvub>-0,if XOUTG) > VUBG) -XOUT G) = МОВА) ;CHG G) = —CHG (i) ;end end 


end 


% Used for semi-infinite optimization 
s = пап; POINT =[]; NEWLAMBDA =[ LAMBDA = (7; NPOINT =(]; FLAG = 2; 
OLDLAMBDA = [7]; 
x(G) = KOUT; М Set x to have user expected size 
% Compute the objective function and constraints 
if strcmpCFUNÍcn (4) ,’seminf" ) 

bg NPOINT.NEWLAMBDA ,.OLDLAMBDA ,LOLD,s] =... 

semifun x, LAMBDA ,NEWLAMBDA ,OLDLAMBDA .POINT FLAG, s,varargin{ 1); 

else 

[fg msg] = opteval (x+FUNfen yvarargin{ :}); 

error (msg) s 

8 = BC:)} 
end 
if isernpty (f) 


error FUN must return a non-empty objective fonction. ' ) 


end 


nestr = length(g); 


% Evaluate gradients and check size 


if isempty (GRADfen) 


analytic gradient = 0; 
else 
analytic gradient = 1; 
[gÍ _user.gg _user,msg] — opteval (x,CRADfen,varargin{ ; $); 
error (msg); 
gf _user == gf user(s 
% Both might evaluate to empty when expression syntax is used 
if isempty (gf user) & isempty(gg _ user) 
analytic gradient = Os 
else % Either gf or gg is defined 
if length (gf _ user) ~= nvars 
error(' The objective gradient is the wrong size.’) 
end 
if isempty (gg _ user) & isempty (g) 
% Make gg compatible 
BE = g'i gg user = g; 
else % Check size of gg 
[ggrow, ggcol] = size(gg _ user); 
if grow ~= nvars 
error( The constraint gradient has the wrong number of rows. ') 
end 
if расо] ~ = nestr 
error ("The constraint gradient has the wrong number of columns. ') 
end 
end % isempty(gg _ user) 
end % isempty(gí user) & isempty (gg _ user) 
end % isempty (CGRADfcn) 


OLDX—XOUT, 
OLDG=g; 
OLDgf =zeroa(nvars +13; 
gf=zeros(nvars, 1): 
OLDAN =zeros(ncstr,nvars); 
LAMBDA = zeros (nestr,1); 
sizep = length (OPTIONS) ; 
OPTIONS = foptions(OPTIONS); 
if lenvlb * lenvlb>0 

if any VLBCO :lenvab)') > VUB), error (Bounds Infeasible'), end 
end 
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for i=1:lenvlb 
if lenvlb>>0,if XOUTG)<VLBG),XOUTG) = VLB(i) + eps; end end 
end 
OPTIONS(18)=1; 
if OPTIONS(1)>0 
if OPTIONS(7)==1 


disp > 
disp(f--COUNT  MAX{g} STEP Procedures’); 
else 
disp E 
dispCf--COUNT FUNCTION MAX eg) STEP Procedures’); 
end 
end 


НЕЅ$ eye(nvars.nvars) ; 

if sizep<1 JOPTIONS(14)= 
OPTIONS(10)=1; 
OPTIONSOD #1; 
GNEW = le8 * CHG; 


0, OPTIONS(14) = nvars ж 100;end 


% 


status 


Main Loop- 


while status ~ = 1 


if —analytic _ gradient | OPTIONS(9) 

% Finite Difference gradients (even if just checking analytical) 
POINT = NPOINT; 
oldf = f; 
oldg = gi 


nostr = length (g); 
FLAG = 0; % For semi-infinite 
gg = zeros(nvars, nestr); % For semi-infinite 
% Try to make the finite differences equal to 1e—8. 
CHG = —1e—8. /(GNEW-+eps); 
CHG = sign(CHG+eps). * min (max (abs(CHG) ,OPTIONS(16)) ,OPTIONS(17)) ; 
ОРТ _STEP = 1; 


for gent= 1 :nvars 


if gent = = nvars, 
FLAG = 一 1; 
end 


temp = XOUT (gent); 
XOUT (gent) = temp + СНС (аст); 
x(G) =XOUT; 


if strcmp(FUNfcn (4) seminf ) 
[g NPOINT.NEWLAMBDA ,OLDLAMBDA,LOLD.s] = = 
semifun(x, LAMBDA .NEWLAMBDA ,OLDLAMBDA , POINT FLAG ,s,varargin (: I) « 
else 
[fig smsg] = opteval(x ,FUNfen varargin t; 2s 
ertor(msg? s 
g == gl); 
end 
ОРТ _STEP = 0; 
if OPT _ STOP 
breaks 
end 
% Next line used for problems with varying number of constraints 
if nestr~ =length(g?, 
dift =length(g); 
g=-v2sort (oldg.g) s 
end 


gl (gent, DD = G—oldf)/CHG (gent) ; 
if ~isempty(g) 
eg(gent.:) = (g — oldg)’/CHG (gent); 
end 
XOUT (gent) 
end % for 
if OPT _ STOP 
break; 


end 


1 


temp; 


% Gradient check 
if OPTIONS(9) == 1 & analytic _ gradient 
gfFD = gf; 
ggFD = ggi 
ER == gg user: 


= gf озегі 


disp (' Function derivative! ) 
if isa(GRADfcn(1) + inline”) 
graderr (gfFD, gf, formula(GRADfen( 112: 
else 
graderr(gfFD, gf, GRADfen{1})5 
end 
if ~isempty (gg) 
disp(" Constraint derivative’ ) 
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if isa(GRADfcn {3} inline ) 
graderr(geFD, ев, formula (GRADfen{3})); 
else 
graderr(ggFD, gg, GRADÉcn (31): 
end 
end 
OPTIONS(9) 0; 
end % OPTIONS(9) == 1 & analytic | gradient 
FLAG=1: % For semi-infinite 
OPTIONS(10)=OPTIONS(10) + nvars; 
f=oldfs 
g=oldg; 
else % analytic _ gradient & options(9) —0 
% User-supplied gradients 
% gf and gg already computed first tıme through loop 
if OPTIONS(10) > 1 
gg=veros(nvars, nestr) y 
[ef seg ,msg]=opteval(x ,GRADIcn ,varargin ( :)); 
error (msg) s 
gf=g{(:); 
if isempty (gg) & isempty(g) 
SE-E': 
end 
else 
% First time through loop 
gg 一 gg user) 
gief_ user; 


end 


if OPT _ STOP 
break; 


end 


end < if ~analytic gradient | OPTIONS() 
AN-gg'; 

how=" з 
ОРТ _STEP=2; 


\Y-------------! SEARCH DIRECTION--- 


for i=1 OPTIONS(13) 
schg=ANG,:) * gf; 
if schg>0 
ANG: 


=- АМ, OO: 


gG)= =g); 
end 


end 


if OPTIONS(11)>1 % Check for first call 
% For equality constraints make gradient face in 
У opposite direction to function gradient. 
if OPTIONS(7)~ =5, 
NEWLAMBDA —LAMBDA, 
end 
[ma ma |= size (AN); 
GNEW--gf + AN! x NEWLAMBDA; 
GOLD- OLDgf --OLDAN' * LAMBDA; 
YL-GNEW GOLD; 
sdiff - XOUT —OLDX; 
% Make sure Hessian is positive definite in update. 
if YL’ + sdiff<OPTIONS(18)* 2* le 一 3 
while YL' x sdiff<—Je—5 
[YMAX, YIND]=min(YL. * sdiff); 
YLOYIND) = YLCYIND)/2; 
end 
if YL * sdiff < (eps * norm (HESS, fro 22; 
how=' Hessian modified twice’ ; 
FACTOR=AN' x g — ОРАМ x OLDG; 
FACTOR=FACTOR. * (sdiff. + FACTOR>0). * (YL. * sdiff< eps); 
WT=1e—2; 
if max(abs(FACTOR)) 一 一 0; FACTOR 一 le 一 5 * sign dil) : end 
while YL' x sdiff < (eps * norm(HESS,'fro')) &. WT < i/eps 
YL=YL+ WT * FACTOR; 
WT=WT ж 2; 
end 


else 
how =’ Hessian modified’ ; 
end 


end 


Perform BFGS Update Н YL'S Is Positive--------- 
if YL’ » sdiff>eps 
HESS=HESS += 
TOL * YL')/CYL' « sdiff) -- 
(CHESS ж sdiff) x (sdiff' « HESS'))/ (sdiff’ « HESS * sdiff); 
% BFGS Update using Cholesky factorization of Gill, Murray and Wright. 
% In practice this was less robust than above method and slower. 


% R==chol (HESS); 
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x 


s2=R * S; y=R'\YL; 
W=cye(nvars nvars) — (82 x 5200082 #827) — (у' *52)\Му*у' Эз 
HESS=R’ «W*R; 


RX 


else 
how= Hessian not updated’ ; 
end 


else % First call 

OLDLAMBDA = (eps+gř' * gf) * ones(nestt,1). /(sum(AN'. * AN’ Y feps) > 
end % if OPTIONSQD1 
OPTIONSCOD =OPTIONS(11)+ Hi 


LOLD—LAMBDA:; 

OLDAN=AN; 

OLDgf— gf: 

OLDG—g; 

OLDF=f; 

OLDX=XOUT; 

XN = zeros(nvars,1); 

if (COPTIONS(7) > 0&OPTIONS(7)<5) 


% Minimax and attgoal problems have special Hessian: 


HESS(nvars,1 :nvars) =zeros(1 snvars) + 
HESS(1 :nvars ,nvars) = zeros(nvars +1); 
HESS (nvars vars) == 1e— 8 * norm HESS, inf 2; 
XNCnvars) max (qp: % Make a feasible solution for qp 
end 
if lenvlb>0, 
АМ=[АМ: -eye(lenvlb,nvars) J; 
GT=[g;—XOUT((1:lenvlb)') +VLB]; 
else 
GT-g; 
end 
if lenvub>0 
AN = [AN ieye lenvub nvars) 2; 
GT —[GT;XOUT( :lenvub)')— VUB]; 
end 
НЕЅ5 = (HESS + HESS) x 0.5, 
[SD. lambda .howqp]—qpsub HESS. gf, AN, —GT .[], LJ, XN OPTIONS(13),—1 
Nlconstssize(AN +1) snvars) 5 


lambda ( (1 ,OPTIONS(13))! )=abs(lambda( (1: OPTIONS(13))" )); 
ga 一 [abs(g( (1. OPTIONS(13))' >) 5 gC (OPTIONS(13)+ 1:ncstr)' ) J; 
if —isempty Gg) 


тпа = max (ga); 


else 
mg=0; 


end 


if OPTIONS(1)>0 
if strnemp(howgp,’ok' ,2)5 
howgp 一 з 
end 
if ~isempty (how) & —isempty (howap? 
how= [how's ']; 
end 
if ОРТІОМ№(7) = =1, 
gamma=mg-+f; 


disp: [sprintf C %5. of %12. 6g ' ,.OPTIONS(10) gamma), + 


sprintf 012. 3g ',OPTIONS(18)>, how, " ”howqp])， 

else 
dispt [sprintfC %5. Of 9612. 6g %12. 6g ' .OPTIONS(100, f, mg), +" 
sprintf %12. 3g ' ,OPTIONS(18)3,how, " t .howqp2: 

end 


end 
LAMBDA —lambda((1 :nestr)’); 
OLDLAMBDA —max([LAMBDA' ;0. 5 * (LAMBDA OLDLAMBDAD ' ; 


3$-——- ——LINESEARCH------------------—-- 
MATX=XOUT; 

MATL =f+sum(OLDLAMBDA. * (ва20). * ga) + 1e— 30; 
infeas=strncmp(howap,’i' 51); 

if OPTIONSC) = =0 | OPTIONS(7) == 


% This merit function looks for improvement in either the constraint 


У or the objective function unless the sub-problem is infeasihle in which 
% case only a reduction in the maximum constraint is tolerated. 

У This less "stringent" merit function has produced faster convergence in 
% a large number of problems. 

if mg > 0 

MATL2=mg; 

elseif £ >=0 

MATL2=—1/(f+1)5 

else 

MATL2—0; 

end 

if ~infeas & f < 0 

MATL2=MATL2 + f — 1; 

end 


else 
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% Merit function used for MINIMAX or ATTGOAL problems. 
MATL2—mg-f; 
end 
if mg < eps & f < bestf 
besti— f; 
bestx = ХОТ; 
bestHess= HESS; 
bestlambde lambda; 
end 
MERIT=MATL + 1; 
MERIT2=MATL2 + 1; 
OPTIONS(13)=2; 
while(MERIT2 > MATL2) & (MERIT > MATL) «= 
& OPTIONS(10) < OPTIONS(14) & ~OPT _ STOP 
OPTIONS (18) = ОРТІОМ8(18)/2: 
if OPTIONSQ8) < 1е—4, 
OPTIONS(18) = —-OPTIONS(18) ; 


% Semi-infinite may have changing sampling interval 
% so avoid too stringent check for improvement 
if OPTIONS(7) == 5, 
OPTIONS(18) = —OPTIONS(18); 
MATL2=MATL2 + 10; 


end 
end 
XOUT=MATX + OPTIONS(18) * SD; 
x()—XOCT; 


if stremp(FUNfen (4) ,'seminf' ) 
[Eg NPOINT.NEWLAMBDA .OLDLAMBDA ,LOLD s 一 … 


semifun(x,LAMBDA ,NEWLAMBDA .OLDLAMBDA .POINT .FLAG s varargin( : 


else 
(£.g.msg]=opteval(x,FUNfen varargin( :}) ; 
error(msg); 
gg); 
end 
if OPT _STOP 
break; 
end 


OPTIONS:10)=OPTIONS(90 + 1; 
ga [abs(g( (1, OPTIONS(13))' )) ; g( (OPTIONS(133+-1;length(g))' )]; 
if ~isempty(g) 

mg —meax(ga); 


else 
mg=Cs 


end 


MERIT :=f+sum(OLDLAMBDA. = (ga>0). * ga): 
if OPTIONS(7)= =0 | OPTIONS(7) = = 5 
if mg > 0 
MERIT2=mg; 
elseif 1 >= 0 
MERIT2 一 -17Gd 十 1) 
else 
MERIT2= 0; 
end 
if —infeas & f < 0 
MERIT2=MERIT2 + £ — 1; 


else 
MERIT2=mg+ fs 


if OPTIONS(7) ~ =5 

mf =abs(OPTIONS(18))+ 

LAMBDA = mí x LAMBDA + (1- mf) + LOLD; 
end 


5 Test stopping conditions (convergence) 


if max(abs(SD})<<2 * OPTIONS(2) & abs(gf' * SDD«2 * OPTIONS(3) & + 


(mg<OPTIONS(4) | Gtrnemp(howgp,'i' 51) & mg > 02) 
if OPTIONS(1)>0 
if OPTIONS(7) = 
gamma —mg- f; 
disp [sprintf C 945. 0f %12. 6g ',OPTIONS(10) gamma) ++ 
sprint 9412. 3g ',OPTIONS(18)) show, ' ',howqp]); 


else 


disp([sprintf C %5. Of %12. 6g %12-6g “OPTIONSC10) ,fmg) = 


sprintí( 4/12. 3g ‘,OPTIONS(18)), how, " ! howapD: 
end 
if ~strnemp (howap, ‘i’, 1) 
disp(/ Optimization Converged Successfully’) 
active const =find (LAMBDA >90); 
if active _ const 
disp(’ Active Constraints ), 


disp(ective _ const) 
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else % active _ const == 
disp No Active Constraints ; 
end 
end 
end 
if (strnemp(howgp, ^i ,1) & mg > 0) 
disp( Warning: No feasible solution found. ' ) 
end 
status= 1; 
else % continue 
% NEED=[LAMBDA>0] | G0 
if OPTIONS(10) >= GPTIONS(14)| ОРТ _ STOP 
XOUT=MATX; 
Í—OLDF; 
if ОРТ STOP 
аір! Maximum number of function evaluations exceeded ;' ) 
disp! ‘increase OPTIONS(14)' > 
end 
status= 1; 
end 
end 


end % while status ~= 1 


% Update 
OPTIONS(12) =OPTIONS(11); 


% 1 a better unconstrained solution was found earlier, use it; 
if f > bestf 
XOUT —bestx 
{=bestf; 
HESS =best Hess; 
lambda=bestlambda ; 
end 
OPTIONS(8)=f; 
x(G)—XOUT, 
if (OPT _ STOP) 
disp (Optimization terminated prematurely by user") 
end 
12. function 
[x OPTIONS. lambda, HESS ]—constr (FUN ,x ,. OPTIONS, VLB, VUB. GRADFUN , varargin) 
函数 CONSTR ЯРА —1- ФЛЕШ ЖК POR SEL. 
и 
【例子 】 
(D X—CONSTR(CFUN' ,X0) 
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влаж, 

FUN 为 一 字符 串 参 数 ,用 以 表示 目标 函数 和 约束 条 件 , 如 ， 

#опЁ=='{=ехр(х(1)) x (41 x(D^2 — 2*х02)^2 + 4 (1) ж (2) 十 2#rXt2) T Dii 

fung="g=[1.5+x(1) + x) -xCD 7 x(2);—x(1) *x(2)—10];; 

FUN- [funt fungl; 参见 使 用 不 例 ; 

Хо 为 初始 搜索 坐标 位 置 ; 

输出 参数 :X 为 最 终 坐 标 位置 ; 

(2) X=CONSTRCFUN',X,OPTIONS, YLB,VUB) 

WASH. 

FUN 为 一 字符 串 参 数 , 用 以 表示 目标 函数 和 约 东 条件, 如 : 

funf='{=exp(x(1)) x (4 *x(1)22 = 2* xGO^2 + х) AA + Zext2 十 Di'i 

fung='g=[1.5 + x(1)*x(2)—x(1)—x(2);—x(D) # х(0) 7005; 

FUN= Чом fung]; 参见 使 用 示例 ， 

X 为 初始 搜索 坐标 位 置 ， 

OPTIONS 为 最 优化 计算 工具 箱 通 用 选择 参数 ,参见 有 关 它 的 说 明 ; 

VLB XRRR FA, A: VLB—zeros(1,22 ,表示 XX >= 0; 

VUB 为 搜索 区 间 上 界 , 如 :VUB 一 [ ] ,表示 没有 上 界 ， 

输出 参数 :X 为 最 终 坐 标 位 置 : 

(3) X= CONSTR(FUN' ,X,OPTIONS, VLB; VUB,'GRADFUN' 

RA SE 

FUN 为 一 字符 串 参 数 ,用 以 表示 目标 函数 和 约束 条 件 д. 

funf-'i—exp(x(D) * (4*х(1)^2+_ 2*х(@)^2 + A*xCD*x(D + 2+x(2) — 155 

fung—'g—[1.5 + х(1) *x(2)—x(1)—x(2); x(1) < x(2)—10];; 

FUN=[funf tung]; 参见 使 用 示例 ， 

X 为 初始 搜索 坐标 位 置 ; 

OPTIONS 为 最 优化 计算 工具 箱 通用 选择 参数 ,参见 有 关 它 的 说 明 ; 

VLB 为 搜索 区 间 下 界 , 如 VLB 一 zeros(1,2), 表 示 X >= 0; 

VUB 为 搜索 区 间 上 界 , 如 VUB=[ ], 表 示 没 有 上 界 ; 

GRADFUN 为 一 字符 申 参 数 ,用 以 表示 目标 函数 和 约束 条 件 的 综 函 数 ,如 : 

dídxl =+'ехр(х(1)) * C4 *х(1)^2+Е2 x^ 2-E 4 x(1) & xCO-E2 * x 2-ED-E4 * exp(x 00 x (2 * 
xCOH xD: 

dídx2—'4 + exp(xCD) * CD x(2 +0. 5945 

dídg-'[x(22) 1, —x(2); 010—1, —xQ23;5 

GRADFUN — [' dí [* ,dídx1, dídx2,']; dg=', dfdg]s 

输出 参数 :X 为 最 终 坐 标 位 置 ; 

(4) [X ,OPTIONS,LAMBDA ,HESS]= 

CONSTR(FUN' ,X ‚OPTIONS, VLB. VUB,'GRADFUN' ,P1,P2,++) 

输入 参数 : 

FUN 为 一 字符 串 参 数 ,用 以 表示 目标 函数 和 约束 条 件 ， 

X 为 初始 搜索 从 标 位 置 ; 

OPTIONS 为 最 优化 计算 工具 箱 遂 用 选择 参数 ,参见 有 关 它 的 说 明 ; 

VLB 为 搜索 区 间 下 界 , 如 :VLB= zeros(1,2), 表 示 X >= 01 

VUB 为 搜索 区 间 上 界 , 如 :VUB 一 [ ] ,表示 没有 上 界 ， 

GRADFUN 为 一 字符 申 参 数 , 用 以 表示 目标 函数 和 约束 条 件 的 导 函 数 ; 
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РР? 
输出 参数 ， 
X ERE: 
OPTIONS 为 最 优化 计算 工具 箱 通用 选择 参数 .参见 有 关 它 的 说 明 
LAMBDA Jj Te f fo b bn fr USE DO Lagrange 乘 子 值 ; 
HESS Jy fe Ref S Ps GL EINE AY Hessian 矩阵 氢 牛 顿 (quasi-Newton) 近 似 值 ， 
【程序 】 

if nargin < 2, error(’constr requires two mput arguments’); end 

if nargin < 3, OPTIONS=[]; end 

if nargin < 4, VLB —[J; end 

if margin < 5. VUB=[_; end 

if nargin < 6, GRADFUN = (7; end 


为 以 M 文件 表示 的 目标 函数 所 需 调 用 的 参数 。 


caller = ‘constr’: 


lenVarIn— length (varargin) ; 


Ж Convert to irline function as needed. 
gradflag—0; 
[funfen ,msg]=prefenchk (FUN caller ,len VarIn ,gradflag) ; 
if ~isempty (msg) 
error(msg) ; 


end 


if ~isempty(GRADPUN) 
gradflag=1; 
[gradfen »msg]=prefenchk (GRADFUN caller. len VarIn gredflag) ; 


if ~isempty (msg) 


error (msg); 
end 

else 
gradfen=[]; 

end 


[x OPTIONS lambda , HESS ]= nlconst (funfen.x OPTIONS, VLB "МОВ, gradfen ,varargin{:}); 
13. function[obj _ best ,ce _ best ] =vsgsa(DimN „region, belta0 delta _ r, delta or dimi; 
函数 vsgsa 为 变 步 长 广义 模拟 退火 算法 子 程序 。 
(AF) 
function[obj best.c _ best] =vsgsa (DimN region beltsü.dela _ r,delta r limit 
BASE. 
DimN 为 优化 问题 的 维 数 ， 
region 为 优化 区 间 ,其 中 region(:,1) 优化 区 间 下 限 ;region《:,2) 优化 区 间 上 限 ; 
例如 ;region==[ 一 5 6 
—56 


dela c 为 初始 步 长 ,根据 具体 优化 问题 选 定 , 如 :delta r—[0.15 0.15 …]， 在 程序 运行 中 将 会 自动 油 


整 
delta r limit 为 终止 步 长 ,根据 实际 情况 选 定 ,如 delta_r_limit 一 1 * 104 (—3) 
belta0 为 退火 参数 , 凭 经 验 选取。 


program for generalized simulated anneal (GSA) applied in CBBL 
JY According to Kalivas etc. AC 1991,63 ; GSA with variable step size 
【程序 】 


b=region; 


[rand * b(1.2) rand < b(2,2)"'; 


current _focation=zeros(DimN.1); 
:DimN 


for i= 
current lecation() —rand * (region(i,2) region (i 12) | region(i,1); 

end 

original _ location = current location; 


obj c--obj fun(current location) i24 El $ú ES CT # PF 


unfav _ count = 


not _fall_in=1; 
succesive not accept—0; 

sampie=03 
ealeu0= zeros(5000,3) ; 

contract num 0; 
c0-100*obj ci 

obj best-10000; 

belts _ new=belta0; 
count _11=1; 

count 22—1; 

change _index=0; 
дес _ factor 


inc factor=1. 01; 


dee _factor= 


inc factor 


para0=0; 


paral==1; 


1⁄5 5050660065 ARGAN ARER A AKAA 
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while 1 
while not | fall in 


randn(DimN 1); 


—u/norm(u); 


c _t=—current _ location Fu. w delta ri 


for i=1,DimN 
if c _-G)>=region(i,1) & с tG)<=regionG,2 
not fal in—0; 
else 
not fal in-1; 
end 


end 


end 


sample=sample+1; 


obj t—obj fun(e D; 


if obj _ r< =obj c 


current _ location=c _t; 
calcu0(sample,3) —1; accepted 
if obj _c<obj best 
obj best=obj c; 


© best—current _ location; %% % М Best result during the session 


Ysucces.ve not _ accept = 
end 


else 


calcu0(sample,1)=1; %First row unfavorable number 


if count_11==1, 
differ9=obj t—obj _c; count _11=count 114-1; 


elseif count. 11 —2, 
differ Y=obj t-obj c--differü; count _11=count 11 +1: 
elseif count. 11——3. 
differd=obj _1-0Ь] c--differó; count ll—count 11+1; 
end 


if count. 11253 
count 22—count 22-1; 
if count 22— —1 


change index 
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else 
change _index=0; 
end 


end 


if change _ index —1 
differ1=obj _t—obj _c; 
beita _new=belta0 ж differ0/ (3 x differ); 
para0= sample; paral=1; 
end 
if expC-nelta _ new * (obj _t—obj_c)/(obj_c—c0))>rand 
abj_c=obj_t; 
current locatione t; 
calcuü(sample,2) =1; %Second row acceptable unfavorable number 
calcu0 (sample 32 —1; 


succesive not _accept=0; 


else 
succesive _ not accept—succesive nor _accept-+1; 
end 
end 
obj. best 
ç best 


max _ delta _r—max(delta _r); 
if max _ delta r«delta r limit 


disp(’ Convergence of algorithm’) 


cputime; 
total time-12—t1; 
pause; 
end 
if samples —100 
if (ample-para0) = = 20 
para0—sample; 
[sample sum (calcu0(sample-19:sample ,2)) /sum(calcu0 (sample-19:5ample, 1)) current _ location (1) 
current_locetion(2) obj _ c 
norm(delta_ r)] 
end 
else 
if (semple-para?) = —20 & parai 
%[sample/100 sum (caleu0(sample-20:sample,1)) 
sum (calcu0(sample-20:sample ,2)) sum (calcu0(sample- 
20 sample, 27) /sum (calcuO sample-20 ;sample,]2) current _ location(1) 
current _location€2) obj _ с succesive not _ accept norm (delta _ r) 


sum(calcu0(sample-19 sample 322/20] 
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if sum (саіспО(ѕатріе-19 :ѕатріе,3))/202>0. 9 
delta _r=delta r*inc factor; 


change _index=1; count 22—0; paral 一 0 


elseif sum (calcu0 (sample-19 :sample,3))/20«:0. 2 
delta r—dela _ r x dec factor; 
change _index=1; count _22=0;parai—0; 


end 


para0—sample; 
[sample sum (calcu0(sarnple-19; sample .2)) /sum (caleuO (sample- 
19:sample ,1)) current _location(1) current. location (2) obj. c 
norm(delta _ r) J 
end 
end 
not fell in-1; % To generate а new random vectors 
e0=obj bes/10; 
end 
var opt—c, 
14. function obj—obj _ fun (location) 
函数 obj iun EPK XUSHEGB CR BOE BUT IQ — + BUE А Н. 


ABH vocation 为 函数 代入 矢量 ,其 形式 为 


x=location(1); 


y=location (2) + 


27 location DimN) ; 


BUSH ЕЛЕЕ IE III 


x=location(1)5 


y=location(2); 


obj=2 ж exp(—0.5 * ((x—1), ^2++(у—3). x (y—3))) =: 
+ехр( —0.5 x (2.5). 924 +5. 5). ж (y+5.5))) e 
+ехр(— 0. 5 x (x —2). ^2+ (у--2). ж (y+ 20205 


obj=—obj; 
15. funcion GLPoiX = glpoix (DimNum  PoiNum) ; 
函数 GLPoiX 用 于 产生 在 (0,1) 区 间 的 好 格子 点 .此 程序 可 用 于 2 或 3 维 空间 的 好 格子 点 ,并 将 结果 在 图 上 


BR. 
【例子 】 


GLPoiX = glpoix (DimNum , PoiNum) ; 
илей. 


DimNum 为 给 定 维 数 ， 
PoiNum 为 给 定点 数 ,对 于 二 维 可 给 定 以 下 数目 ， 
813 21 34 55 89 144 233 377 610 987 
对 于 三 维 可 给 定 以 下 数目 : 
35 101 135 185 266 418 597 828 1010 1220 1459 

输出 参数 :GLPoiX 为 相应 空间 的 好 格 于 点 。 

参考 文献 : 

KaiTai Fan, Yuan Wang 

“Number-theoretic Methods in Statistic” , Chapman & Hall, (1994), 

【程序 } 
X=[8 13 21 34 55 89 144 233 377 610 987 
11111111111 
5 8 13 21 34 55 89 144 233 377 610]; 
X1=[35 101 135 185 266 418 597 828 1010 1220 1459 
11111111111 
11 40 29 26 27 90 63 285 140 319 256 
16 85 42 64 69 130 169 358 237 510 373]; 


if DimNum = —3 

X-Xl; 

end 

GLPoiX = zeros (DimNum , PoiNum) ; 
{m.n]=size(X); 


for i— 


for i=1:DimNum 
+PoiNum 


for j= 
GLPoiX (1,7) = (j * XG+1,k)—0. 5)/X O1 — fix (Gj + XG—1,k) —0- S/XOKk»: 


end 

end 

if DimNum— —2 
plot(GLPoiX (1, 2 ,GLPoiX(Q, 1.) 

end 

if DimNum= —3 


subplot (221) ,plor(GLPoiX (1, 2 ,GLPoiX (2, :),'. 7 
subplot( 222) splot (GLPoiX (1, :) sGLPoiX (3, :2.*. 2 
subplot(2235 plot (GLPoiX (2, :) +GLPoiX(3.:)4'.") 


end 
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16. function [opti,reg ]—sntopti(b,DimN,PoiN.y.x1); 
BR snopi 为 序 贯 数论 优化 子 程序 . 
【例子 】 
[opti,reg]=sntopti(b,DimN,PoiN,y,x1); 
влаж. 
DimNum 为 给 定 维 数 ; 
PoiNum 为 给 定点 数 ,对 于 二 维 可 给 定 以 下 数 日 :8 13 21 34 55 89 144 233 377 610 987 
对 于 三 维 可 给 定 以 下 数目 : 
35 101 135 185 266 418 597 828 1010 1220 1459 
b 为 待 优化 的 初始 矢量 ; 
yxl 为 待 优化 函数 中 的 所 需 数 据 ,本 例 中 为 相应 矢量 和 校正 矩阵 。 
答 出 参数 ， 
opti 所 得 最 优 目标 函数 值 : 
reg 为 相应 的 空间 位 置 。 
【程序 】 
respOpt= 5000. ; 
GLPoiX = glpoix (DimN ,PoiN) ; 
size GLPoiX? 
pause 


for k=1:10 


for i- 1: DimN 
b1G, D — 0,2) —b6,13: 
end 
for j=1:PoiN 
resp=imsobj (bl. * GLPoiXG -FbG Dy xD) 


if resp —respOpt 
respOpt = resp. 
OptPoint(: ,1)=b1- * GLPoiX (; j) +b: 12 
else 
end 
end 
opti— respOpt ; 
reg — OptPoint; 


for i=1:DimN 
btem1— [OptPoint(i 1) —b16,12/4 bG DJ; 
btem2= [OptPointG., 1)-- b1G 1/4 4,22): 
bG.1)=max(btem1)+ 

bG.,2)=min(btem2); 

end 


disp(b) 
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end 
end 
17. function son=mate(popu) 
BR mate 为 遗传 算法 中 的 交叉 函数 。 
【例子 了 
son =mate (popu) 
输入 参数 :popu WMA, 
输出 参数 ;son 为 交配 过 程 中 产生 出 来 的 子 代 。 
ter) 
(dimen ,psize] = зіге (popu) s 
son=zeros (dimen :psize) 
matesite = rcund (rand (dimen ,psize/2)}. + (rand (dimen .psize/2) — 0. 5) * 2; 
ј=0; 
for i=1:2:psize 
jcith 
sonl: i) =рори(: ,) + (popul; ,i+ DD — popu C: ,12). є matesite(: ,j); 
son, 11-1) 9 poput: i - 1) 7 (popul: i 12 — popul: 4D). * matesite(; Di 


end 
18. function son —mutate(popu, pmutate , mutatec ) 
BR mutate 为 遗传 算法 中 的 变异 函数 。 
【例子 】 
son=mutate(popu:pmutate, mutatec) 
BASE. 
popu HREH: 


pmutatc 为 遗传 进化 中 的 变异 率 ; 
mutate 为 变异 步 长 。 
输出 参数 ,son 为 变异 过 程 中 产生 出 来 得 子 代 。 
【程序 了 
site= rand (size(popu)) « pmutate, 
son—popu + site. * (rand(size(popu)) —0. 5) x 2 ж mutatec; 
19. function parent =select (popufit) 
BARE select Jy ih fe Merk rh AEE ХАЖ. 
AF) 
parent select (popufit ) 
输入 参数 :popufit 为 染色 体 适 应 性 。 
输出 参数 ;parent 选 作为 父 代 的 染色 体 。 
【程序 】 
psize= length (popufit ) ғ 
fitsum =sum(popufit); 
ind =rand(1,psize) x fitsum з 
parent —ones(1 ,psize) ; 
for i=1:psize 
parent — parent + (sum(popufit (1 ;i)) ind) + 


end 
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20. function offspr=compet(poputit ,psize》 
AR compet IEAA P HF BRR 
【例子 】 
offspr =compet (popufit ,Pslze) 
BASH: 
popufit 为 染色 体 送 应 性 ， 
psize 染色 体 个 体 数 目 
输出 参数 :offspr 通过 竞争 产生 的 新 千代 。 
【程序 】 

offspr=zeros(1 -psize); 

[mixima ind ] тах Cpopufit? ; 

offspr(1) =ind ;popufit(ind) = 0; 


for i— 2 ipsize 
fitsum = sum (popufit) ; 
ind—rand + fitsum ; 
2-1, 
while sum(popufit (1:32) «ind 
j=itls 
end 
offspr G)=j:popufit())=0s 
end 
21. function popufit = fitness (popuerr) 
HUE fitness WER ih B FH BET BUT: 
【例子 】 
popufit = fi:ness(popuerr } 
输 人 参数 :>opuerr 与 染色 体 对 应 的 误差 。 
输出 参数 ;20pufit 为 染色 体 适应 性 。 
【程序 ] 
popufit = —ones (size (popuerr)) . /popuerr; 
22. function Н = hadamard(n) 
函数 HADAMARD 用 于 产生 Hadamard 矩阵 。 
【例子 了 
H=hadamard(N) 
WA BN 表示 想 要 得 到 的 Hadamard 矩阵 的 阶 数 。 
输出 参数 , 理 为 一 只 含 元 素 1 或 一 1 的 Hadamard ЖЕЕ, A +H = N*EYE(N). 
注意 :n 为 一 个 可 被 4 整除 的 数 ,而 且 , 此 程序 只 能 用 于 当 N. №12 or N720 都 是 2 钓 麦 函数 的 情况 , 即 玉 一 
2 N/12==2';N/20=2) WARM. 
【程序 】 
(f,e]=log2([n n/12 n/20]); 
k=find({==1/2 & e>0); 
if min(size(n)) > 1 | isempty¢k) 
error([^n must be an integer and n,n/12 or n/20 must be a power of 2. D: 
end 
e—e(l2- 1: 


ifk-—1 % N-l* 2'e; H=1; 


elseif k== 2 — X N=12» 2^e 
H— [ones(1;12);ones(11,1) =- 
toeplitz([--} —11—1—1—J111-—11[-011-1111-1-1-11-1)J; 


elseif k— —: M N~20™ 2'e; 

H [ones (1,20) ;ones(19,1) 

hankel ([- 1 —111 151 1 11 11 114111- 1 -11]-— 1-1—111—-1-—1-1 
—11—11—11111—1—-1])J; 


end 


% Kronecker product construction. 


fori-lic 
H=(H H 
H H]; 
end 


23. function [b,bint,r,rint] =regress(y,X alpha) 
函数 REGRESS 用 最 小 二 乘 方法 来 进行 多 元 线性 回归 。 
(AF) 
(р) b=REGRESS(y.X) 
输入 参数 : 
X — (nx p) BEERE; 
y 是 一 个 CnX1) 阶 相应 矢量 。 
输出 参数 :b 是 一 个 人 4pX1) 回 归 矢 量 , 即 y 一 Xb。 
(2) [B.BINT,R.RINT,STATS]=REGRESS(y,X alpha) 
BAS. 
X 是 一 个 nxp) 阶 校正 矩阵 ; 
Y 是 一 个 tnX1) 阶 相应 矢量 ; 
alpha 为 置信 水 平 的 百分数 ; 
输出 参数 :b 是 一 个 (pX1) 回 归 矢 量 , 即 y=Xb; 
BINT 为 回归 矢量 的 置信 区 间 ，; 
R 为 残 差 矢量 ; 
RINT 为 残 差 矢量 的 置信 区 间 ， 
会 考 文献 : 
1 Samprit Chatterjee and Ali S. Hadi, “Influential Observations „High Leverage Points,anc Outliers in Linear Regression”, 
Statistical Science 1986 Vol. 1 No. 3 pp. 379~416 
2 N. Draper and H, Smith, "Applied Regression Analysis Second Edition" , Wiley, 1981 
DER] 
if nargin < 2, 
error REGRESS requires at least two input arguments. ') + 


end 
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2 
alpha=0. 05; 


if nargin= 


end 


% Check that matrix (X) and left hand side (y) have compatible dimensions 
Га.р]= ех); 
[nl,collhs ] — size Cy) : 
ifa~=nt, 
error (The number of rows in Y must equal the number of rows in X.")+ 


end 


if collhs ~ =1, 
error(/¥ must be a vector snot a matrix’); 


end 


% Find the least squares solution. 
[Q,RJ=qr(X,0)s 
b=RX(Q' * y). 


% Find a confidence interval for each component of x 


% Draper and Smith ,equation 2. 6. 15 .page 94 


RI=R\eye(p); 
xdiag=sqrt(sum((RI. * К) 


nu—n—p; % Regression degrees of freedom. 
yhat=X * bi % Predicted responses at each data point. 
r=y—yhat; % Residuals. 
if nu 一 一 0 

rmse=norm (r)/sqrt (nu) ; % Root mean square error. 
else 

rmse= Inf; 
end 
s2=rmse* 2; % Estimator of error variance. 


tval=tinv((1—-alpha/2) nw)s 


bint=[b— tval + xdiag х rmse,b-+tval * xdiag * rmse ]; 


站 Calculate R-squared. 
if nargout — = 5, 


RSS=norm (yhat— mean(y))^ 2; % Residual sum of squares. 


TSS=nerm(y—mean(y))* 2; % Total sum of squares. 
r2=RSS/TSS, 5⁄4 R-square statistic. 

F= (RSS/(p—1))/s2: И F statistic for regression. 
proh 一 1 一 fedf(F ,p—1snu); % Significance probability for regression 


stats=[r2 F prob]; 


end 


% Find the standard errors of the residuals. 
34 Get the diagonal elements of the “Hat” matrix. 
% Calculate the variance estimate obtained by removing each case (1. e, sigmai). 
У see Chatterjee and Hadi р. 380 equation 14. 
T-X» ВІ, 
hatdiag=sum (T. * T) 
if nu<1, 
ser=rmse * onesClength G) D s 
elseif nu>1 
sigmai = sqrt ((nu * s2/(nu 一 1)) = (r, ^2./ ((u—1) . * (1—hatdiag)))); 
ser=sqrt(]—hatdiag) . х sigmais 
elseif nu 一 一 1 
ser 一 sqrt(1 一 hatdiag) . + rmse; 


end 
ti=r./ ser; 


% Create confidence intervals for residuals, 
Z=[(r—tval » ser} (r+tval ж ser] 
rint 一 Z 5 
24. function regstats (responses ,data , model) 
BH REGSTATS 用 于 对 线性 模型 的 回归 诊断 。 该 函数 提供 了 一 个 对 话 界面 ,可 得 几乎 所 有 单 点 诊断 的 
信息 。 
[5171 
REGSTATS(RESPONSES.DATA ,MODEL) 
输入 参数 : 
RESPONSES 为 一 (nX1) 阶 相应 攻 量 ; 
DATA 是 一 个 (nXp) 阶 校正 矩阵 ; 
字符 申 参 数 MODEL 表示 所 选择 的 回归 模型 ,其 孤 置 值 为 一 个 包括 常数 项 的 线性 加 合 模型 ， 
当 MODEL= ‘interaction’ 时 ,表示 一 个 包括 常数 项 ,线性 项 和 交叉 项 的 回 时 模型 ; 
当 MODEL — ‘quadratic’ 时 ,表示 一 个 包括 常数 项 .线性 项 ,交叉 项 以 及 平方 项 的 回归 模型 ; 
当 MODEL 一 ‘purequadratic? 时 ,表示 一 个 包括 常数 项 线性 项 和 平方 项 的 回归 模型 。 
输出 参数 ， 
Q 从 QR 分 解 中 得 到 的 Qi 
R 从 QR 分 解 中 得 到 的 R; 
beta MHRA 
cob ”回归 系数 的 方差 
yhat 相应 矢量 的 拟 合 值 ; 
г RBA 
mse HHH: 
Leverage BEKARE; 
Hatmat MTER: 
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s2 i 剔除 1 点 数据 后 的 方差 ， 
beta і Ж i 点 数据 后 的 回归 系数 ; 
Standres ”标准 化 残 差 ， 
studres FARE; 
dfbeta ”回归 系数 的 变化 ; 
difit RAKSHA EK: 
difirs R X B f E HE ELE  Scaled Change in Fitted Values." 
Covratio 协 方差 变化 率 ; 
соска Соок 距离。 
【程序 】 
if ~isstr (responses) 
action 一 start ; 
else 
acrion=responses; 


end 


% On recursive calls get all necessary handles and data. 
if ~stremp (action, ‘start’ ) 

diagfig—findobj(' Tag’ , diagfig' s 

ud=get (diagfig ,/UserData’ )s 

y=ud(1); 

X=ud(2}s 

idx=ud{3}s 

texthandle=ud{4}; 


end 


% Initialize GUL 
if stremp (action , start ) 
if nargin < 3 
model —'linear' ; 
end 
X=x2fx (data model) ; 
diagfig —figure(' Units’ , Normalized’ , --- 
‘Position’ ,[0. 1 0.5 0. 5 0.5], Colo ,[.5 ,5 . 5; 
"Userdata' › (responses. X ,[J,[J) ' Tag’ , diagfig )s 


textlables=str2mat('Q from QR Decomposition’ ,'R from QR Decomposition’ ,’Ccefficients’ ,'Coefficient 
Covariance’ ,/Fitted Values) + 

textlables= str2mat (textlables,’ Residuals’ ,’ Mean Square Error’); 

textlables= str2matGextlables,' Leverage! ,' Hat Matrix’ , Delete —1 Variance’); 

textlables= str2mat textlables ," Delete — 1 
Coefficients’ , Standardized Residuals') ; 

textlables= str2mat(textlables,’Studentized Residuals’ ,' Change in Beta’, = 

' Change in Fitted Value’ .Scaled change in Fit’) 


textlables— str2mat (textlables,'Change in Covariance’ .'Cook' 's Distance; 


varnames ~ ('Q' ,'R' ,'bets' »’covb’ ,'yhat' ,‘r' ,’mse’ . leverage’ , hatmat' уя i'i 


‘beta _i', standres' ,'studres' ,/dfbeta’ .'dffit' .’dffits! ,'covratio’ .'cookd’ 1; 


uicontrol (diagfig .' Style’ ,'text' ,"Units' , "normalized! , «+ 
' Position’ , [ 0. 02 0. 92 0. 4 0. 04] 
"BackaroundColor ,[. 5 .5 .5]，… 


"Stang! Regression Diagnostics” ,ForegroundColor ,k'); 


uicontrol! diagfig .' Style' ‘Pushbutton’ ,"Units' “normalized! ++ 
‘Position’ , [0. 5 0.92 0.3 0.06], 
"BackgroundColor' , [. 
'String’ ,'Calculate Now’ ,'ForegroundColor” ,'k' 


.5.5]. 


'Callback' , ['regstats("calculate J); 
chk boxes = гегоѕ(18,1); t 
for k= 1,18 
boxesl=rem(k—1,9) +15 
boxrow = floor (k/9— eps); 
chkboxesCk) = 
uicontrol (diagfig,' Style’ ‘checkbox’ , Units’ normalized’ «+ 
‘Position' , [0. 024-0. 45 * boxrow 0. 9—0. 1 * boxcol 0. 4 0.07]，… 
'BackgroundColor' ,w' ,'String' vextlables(R,;), Tag sintZstr{k), 55 
'UserData' , varnames {k} ,' ForegroundColor ,'k'); 


end 


close _ button —uicontrol Style! , Pushbutton! , Unts' normalized! , =+ 
Position’ ,[0. 90 0 0. 07 
0. 07], Callback! ,' close’ ,’String’ , Close; 


help _ button —uicontrol Style! .' Pusbhutton' , Units! . normalized" 
‘Position’ ,[0. 90 0. 10 0. 07 
0. 07]. Callback' ,' regstats ("help") ‘String’ , Help; 


elseif stremptaction ,'calculate') 

varhandles —zeros(18,1) ; 

idx= (1:18); 

varnames=cell(1841)+ 

for К=18:—1:1 
varhandies(k) = findobjCgef , Tag’ sint2str(k)) ; 
if get(varhandles(k) ,' Value!) = = 0,idx(k) = [ ];end 
varnames {k } =get (varhandles(k), UserData ); 


end 


for К = :length (idx) 


ол 
S 
© 
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if k= =] 
entrystr=varnames {idx (k) }; 
else 
entrystr=[entrystr,’,' ,varnames(idx(k)}]; 
end 
end 
instr =varnames (idx) ; 
promptstr=='Enter variable names for regression diagnostics or use defaults. ' ; 
dlghandle— dialog ( Visible’ ,'off' ,' WindowStyle’ , modal) ; 


set (dl ghandle.' Units’ ,' pixels ,' Pasition' , [100 300 400 
100],'Visible' ,'on' ); 
uicontrol (dighandle,' Style’ ,'text' ,' Units” ‘pixels’ „+ 
‘Position’ [10 75 380 20], 


‘String’ promptstr) s 


texthandle 


icontrol (dighandle ,' Style" .’edit’ .' Units’ ,' pixels .--- 
' String! ,entrystr , HorizontalAlignment' ,"left') ; 
txtlength = get (texthandle, ‘Extent’ ) ; 
if txtlength (3) > 350 
pos= [10 30 380 40]; 
set (texthandle ,' Max' ,2,' Position’ pos) 
else 
ров=[ (180 — Ceeil(txtlength (32/2)2-2- 152 40 txtlength (3) -29 207; 
set (texthendle +’ Position” ,pos) 


end 


ok button uicontrol(’Style’ ,' Pushbutton’ ,” Units” , pixels’, 
‘Position’ , [180 5 40 
20],'Callhack’ ,' regstats output") ;close (gebf)” »' String’ OK' 


ud {3} —idx; 

ud {4} =texthandle; 

set (diagfig.’ UserData’ sud) ; 
elseif stremp (action ,’output’) 

[Q,R]=ar(X.0); 

beta - RKQ' xy); 

yhat=X * beta, 

residuals=y— yhat; 

nobs—length y) ; 

p=min(size(R)) + 

mse=sum (residuals. * residuals). /(nobs—p); 

E-X/R; 

h—sum((E. + Е); 


s _sqr _ i= ((nobs—p) + mse — residuals. * residuals. /(1 —h)). /(nobs—p-~ D: 


e _i=residuals, /sqrt(s _sqr i. * (1—h)); 
ric RVeyetp?: 
хіі x ni s 
s—get (texthandle .’String’ ) : 
cpos— findstr (s. +"); 
И isempty (cpos) 
C= (5): 
else 
nvars— ength(cpos) +1; 
C—celltnvars 3); 


for kc i:nvars 


s(1:cpos(D. —1)» 
elseif k= =nvars 
Ck) =sC(cpos(k--1) +1) :end2; 


else 
(к) =s((cpos(k — 1) +1) : (cpos(k) —1)); 
end 
end 
end 


if (any(idx==1)) 
% Q from the QR decomposition of the X matrix, 
Qstr=C {find idx =D} 5 
Qstr= fliplr (deblank fliple(Qstr)22 
assignin (base ,Qstr,Q); 


end 


20 

34 R from the QR decomposition of the X matrix. 
Retr—C(findGdx e =2)}+ 

Restr =fliplrCdeblank fliplr Ret) 5) + 


assignin (base! ,Rstr R); 


if (any Gdx— 


end 

if (any (idx= =3)) 
% Coefficients. 
bstr=C {find idx = =3)}; 
bstr = ріг Cdeblank Cfliplr Cbstr)) ) 5 
assignin ( base! ,bstr sbeta) s 

end 

if (any dx =4)) 
% Covariance of the parameters. 
covb= xtxi * mse} 


covbstr=C {find Gdx= =4)}5 
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covbstr=fplr(deblank(fliplr(covbstr))); 
assignin('base' ,covbstr,covb); 
end 
if (any(idx= =5)) 
% Fitted values. 
yhatstr=C {find (idx= = 5)}s 
yhatstr = fliplr (deblank (fliplr (yhatstr )) 5 
assignin ( Ease! ,yhatstr ,yhat)} 
end 
if (any (idx = =6)) 
Ж Residuals. 
rstr~-C (find Gdx==6)} ; 
rstr=fliplr (deblank (fliplr(rstr))); 
assignin С base’ rstr residuals) ; 
cnd 
if (апубйх==7)) 
1⁄4 Mean squared error. 
msestr=€ {find (idx = =7) } 5 
msestr= fliplr (deblank Cfliple (msestr) 32 ; 
assignin (’ base’ ,msestr ,mse) ; 
end 
if (any Cidx — =8)) 
Y Leverage. 
hstr=C{find(idx= =8)}; 
hstr— Шри (deblank (fliplr (hstr222 5 
assignin( base! ,hstr ,h); 
end 
if (any(idx= =9)) 
% Hat Matrix. 
hatstr=C{find(idx==9)}; 
hatstr=fliplr (deblank (fliplr hatstr))2 ; 
assignin(‘hase’ ,hatstr ,Q + Q'); 


end 
if (any(idx==10)) 
X Delete 1 variance. S I 
dlvstr=C (find Gidx==10)}; 
dlvstr — Бр (deblank (fliplr (dlvstr))) 5 


assignin( base ,dlvstrs _ sqr Di 


end 


if (any Cidx — 7112). | (any(idx==14)) 
% Delete 1 coefficients. BETA I 
stde— residuals. /(1—h); 
stde —stdet : ,ones(p. 12; 


b _i=beta‘;,ones(nobs.1)) — ri * (Q. * stde) 


if (any'idx 一 一 11))， 
dlbst-— C {find (idx= =11)}+ 
dlbstz =fliplr(deblank (fliplr (djbstr) 225 
assign (base ,dibstr,b D; 
end 
end 
if (any Gdx==12)) 
5⁄4 Standardized residuals. 
ristr=C [find üdx==12)}); 
riser—fliplr (deblank ріг Crlste)2) 


assignin ( base' ,rlstr ,residuals, /(sqrt(mse * (1 -һ))))$ 


end 

if (anyGidx = =13)) 
% Studentized residuals. 
réstr=C {find dx= =13)}: 
r2sur=fliplr deblank (fliplr(r2str)) > ; 


assignin( base r2str,e Ds 

end 

if (anyGdx— = 140) 
% Change m beta, DFBETAS 
b=beta(; sones(nobs,1)); 
8 一 sqrtts _ sgr _ iiyones(p,1)) 5 
rtri=sqrt (diag (xtxi)); 


таті ті sones(nobs 1); 
dfbeta= (h — b D. /Cs * ruis 
dfbstr= C(findGdx— = L3; 
dfbstr= flipl (deblank (fliplr(áfbstr))); 
assignin (base ,dfbstr sdfbata) ; 

end 

if (any idx ==15)) 
% Change in fitted values. DFFIT 
dffitstr=C {find idx = =15)} 5 
dffitstr:= рі (deblank Ciplr(dffitsiz))) + 
assignin("base’ ,dffitstr sh, ж residuals. /(1—h)); 


end 
if (anyGdx— =16)) 
% Scaled change in fitted values. DFFITS 
“(find (idx = =16)1; 
liplr (deblank (fliplr (sdftitsur) >) + 


sdffitstr= 
sd ffitst 


assignin U base ,sdffitstr „sqrt (h, /(1—h)). же D: 


end 
if (any Gidx= =17)) 
% Change in covariance, COVRATIO 


covr= (((nobs -p= l-re i. же D. /(nobs~p)). ^p 


fhe 
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covrstr=C {find idx = =17)}; 
covrstr=fliplr (deblank (fliplr (covrstr))) ; 


assignin ( base’ ,covrstr .covr) ; 


% Cook's Distance. 

d-=residuals. * residuals. * (h. /(1—h)). /ps 
cookstr— € {find (idx = —182); 

cookstr = ‘liplr (deblank (fliplr Ccookstr)) + 
assignin ( base’ ,cookstr.d2 ; 


end 


elseif strcmp (action ‘help’ ) 

str{1,1}=’Regression Diagnostics’ ; 

str{1,2}={ 

"Regression Diagnostics 

‘The literature suggests many diagnostic statistics for evaluating’ 
‘multiple hnear regression. The usual regression model is,’ 
ty=Xb+e 

‘where y is an n by 1 vector of responses 


' x is an n by p matrix of predictors,’ 


' b is an р by 1 vector of parameters,’ 


e is an n by 1 vector of random disturbances. ' 

n ' 

"Let X—Q * R where Q and R come from а QR Decomposition of X." 
"О is orthogonal and R is triangular. Both these matrices are’ 


"useful for calculating many regression diagnostics. ' 


' The least squares estimator for b is.’ 
'b=RN(Q' буз! 


"То learn more about the diagnostics supplied by regstats,use the' 


‘Topics popup menu. A list of the Topi 
' 09 from QR Decomposition. ' 

' DR from QR Decomposition. ' 

”  DRegression Coefficients.’ 

DO Covariance of regression coefficients. ' 
O Fitted values of the response data. ' 

' DhResiduals.' 

' [Mean Squared Error. 

DLeverage ' 

' DHat Matrix." 


ÜDelete- Variance. " 

'— DDelete-1 Coefficients. " 

'— [Standardized Residuals. " 

， GStudentized Residuals. " 

D Change in Regression Coefficients. 
‘Change in Fitted Values." 
"Scaled Change in Fitted Values. ' 


D Changs in Covariance, " 

' DCook' 's Distance. ' 

h 

str(2,1) &'QR Decomposition (Q): 
stel, 21-1 

'Q from the QR Decomposition of X." 
‘MATLAB code;' 
'TQ.RJ=qr(X,o) 


‘This is the so-called economy sized QR decomposition. ' 


"О is n by p. Q is also orthogonal. That is,’ 
Q ' * Q=I (the identity matrix)’ 
E 


str(3, 1) — QR Decomposition (R)' s 

str(3,2) =: 

"К from the QR Decomposition of X, 

"MATLAB code; 

'[Q.RJ=ar(X,0) и 

' ; 

"This is the economy sized QR decomposition. ' 

'R is p by p and triangular. This makes solving linear ^ 
‘systems simple.” 


hi 


str{4,1}='Regression Coefficients’ + 
si^ 2)71 


"Regression Coefficients’ 


'MATLAB code: 

=RNQ ey 

"If you only wanted the coefficients and " 
‘did not want to use Q and R later ,then;^ 


беу 
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is the simplest code. ' 


Ve 


str{3.1}='Coefficient Covariance’ ; 
этї5,2}={ 


‘Covariance of Regression Coefficients’ 


"MATLAB code,’ 
' V Inverse of R' 
'ri=RNeye(p);' 


"nv (X° "XY 
'xixi ii ri "y 


' % Covariance cf the coefficients.’ 
‘covb=xtxi * mse;' 


‘MSE is mean squared error. ' 
'covb is a p by p matrix. The diagonal elements are the variances’ 


‘of the individual coefficients, ' 


h 


str(6,1) 
str{6,2}= 
‘Fitted Values cf the Response Data’ 


Fitted Values’ ; 


"The usual regression model i 


'y=Xb+e’ 


‘where y is an n by 1 vector of responses,” 


' xis an п by p matrix of predictors." 


И bis an p by 1 vector of parameters,’ 


' е is ап n by 1 vector of random disturbances. " 


‘Let X=Q * R where Q and R come from a QR Decomposition of X. ' 
'Q is orthogonal and R is triangular. Both these matrices are" 


‘useful for calculating many regression diagnostics. " 


' ' 


‘The least squares estimator for b is 


'b=RN(Q' "xy 


' , 


‘Plugging this estimate for b into the model equation (leaving out e) we have; 
‘yhat=X *b=X x (R\(Q’ жу) 


‘where yhat is an n by 1 vector of fitted (or predicted) values of y.' 


str(7,1)='"Residuals'; 

эг{7›2}={ 

‘Residuals’ 

‘Let y be ar n by 1 vector of responses sand’ 

'yhat be an n by 1 vector of fitted Cor predicted) values of y. 


‘Then the residuals ,aiso n by 1 are: 


!r=y—yhat' 


‘In English. the residuals are the observed values minus the predicted values." 
h 


str(8,1}='Mean Squared Error’ з 

str{8,2)= 

*Mean Squared Error! 

， ， 

“The mean squared error is an estimator of the variance of the random! 
‘disturbances «which 1 assumed constant. ' 


n Й 


“The formula is:' 


'mse—r' ‘en /(n—py 
‘where r is the n by 1 vector of residuals. ' 


n is the number of observations. ' 
' p is the number of unknown parameters. ” 


h 


эп{9,1) = Leverage ; 

str(9,2)= 

‘Leverage’ 

Й ' 

"тһе leverage is a measure of the effect of a particular observation on the ’ 
‘regression predictions due to the position of that observation in the space" 

‘of the inputs." 

"In general,the farther a point is from the center of the input space the" 

'more leverage it has." 

‘The leverage vector is an n by 1 vector of the leverages of all the observations. И 


ft is the diagonal of фе hat matrix.’ 


"MATLAB code! 
'h— diag(Q + Q' P 


str(10,1)—'Hat Matrix’; 
sui10,2)1—( 


"Hat (Projection) Matrix" 


"The hat matrix is an n by n matrix that projects the vector of ' 
' observations, y onto the vector of predictions .yhat.thus putting ‘ 


“the “hat” on у.' 


, i 


"MATLAB code. " 

'н =Q+q "uy! 
'yhat=H * y; 

h 


str (11,1) —'Delete — 1 Variance’ ; 
strill.2)—( 
'Delete—1 Variance’ 


‘The delete —1 variance is an n by 1 vector- Each element of the vector is the’ 
‘mean squared error of the regression obtained by deleting that observation." 


y 


str{12,1}='Delete—1 Coefficients’ ; 
str{12,2}={ 
'Delete —1 Coefficients’ 


"Тһе delete —1 coefficents а an p by n matrix. Each column of the matrix is the ' 
‘coefficients of the regression obtained by deleting corresponding observation. ' 


h 


str(13,1)=' Standardized Residuals’ ; 
str(13,2)= ( 
"Standardized Residuals’ 


"Тһе standardized residuals are the residuals normalized by a measure of their 
‘standard deviation. ' 

Й Й 

‘MATLAB code. 

‘stanres= residuals. /(sqrt(mse * (1—h))) y” 

‘where mse is the mean squared error.’ 


and h is the leverage vector. ' 


"See also; Studentized Residuals .' 


h 


str (14,1) —'Studentized Residuals’ ; 

stri14,2}={ 

‘Studentized Residuals’ 

"The studentized residuals are the residuals normalized by a measure of their ' 


"standard deviation. ‘ 


‘MATLAB code: 
'studres = residuals. /(sqrt(s2t * (1—h)}) 5" 
‘where s2i is the delete-1 variance.’ 


' and h is the leverage vector." 


‘See also: Standardized Residuals. * 
н 


вїг{15,1}=='СҺапде in Coefficients’ ; 

str{15,2}={ 

‘Change in Regression Coefficients (DFBETA)’ 

n r 

'DFBETA is an p by n matrix. Each column of DEBETA is the scaled effect of ^ 
‘removing the corresponding point on the vector of coefficients. ' 

h 


str 16,1) —' Change in Prediction’ ; 

str{16,2}=1 

"Change in Fitted Values (DFFITY' 

'DFFIT is an n by 1 vector. Each element is the change in the fitted value’ 
caused by deleting the corresponding observation. ' 

， ' 

"MATLAB code! 

'dífit— h. * residuals. /(1—Һ)' 

"where h is the leverage vector. ' 


h 


str(17, 1) —'Scaled Change in yhat' ; 

str(17,2)= l 

‘Scaled Change in Fitted Values (DFF1TS)' 

"Scaled DFFIT is ап n by 1 vector. Each element is the change in the fitted value ' 


"caused by deleting the corresponding observation and scaled by the standard error. ' 
' n 


'MATLAB code:" 
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“sdffit—sqrt(h./(1—h)). же i! 
"where е i is the vector of studentized residuals. ' 


and h is the leverage vector.’ 


str(18,1j —'Change in Covariance’ + 

str{18,2)={ 

‘Change in Covariance! 

'DFCOV is an n by 1 vector. Each element is the ratio of the generalized ' 
‘variance of the estimated coefficients when the corresponding element is ' 
‘deleted to the generalized variance of the coefficients using all the data. ' 


h 


str (19,1) —' Cook" 's Distance’ ; 

stri19,2)—1 

"Cook! 's Distance’ 

‘Cook’ 's distance is ап n by 1 vector. Each element is the normalized change ' 


‘im the vector of coefficients due to the deletion of an observation. 
' , 

"MATLAB code:' 

'd—residuals. x residuals. * (h, /(1—h)), /py' 

! where d эз Cook! 's distance, ' 


' h is the leverage vector. ' 


h 


and p is the number of unknown parameters. ' 


for k=1,19 
str(k. 21 - char(strik. 2); 
end 


helpwin (str, Regression Diagnostics’ ,' Regression Diagnostics Help 


end 
28. function [ec,c,v]=kalmfil (x,y); 
函数 kalmšil 可 用 于 直接 校正 的 kalmam 估计 
【例子 】 
[cc sc v] = каша (х,у), 
BASH: 
x 是 一 个 CnXp) 阶 校正 矩阵 ; 
y 为 一 (n>:1) 阶 相应 矢量 。 
输出 参数 ; 
с Kalman 递 推 估计 和解 系列 矩阵 ; 
* 其 信息 系列 矢量 ， 


cc A TRE 


ЕВА: eC AT FP PL TRETT E 
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> [xi.yl = simuld(3,[1 1 1],[25 35 45J,[7 7 8J,[.5 .6 .7).135 48 50],[8 7.6 6],. 04, 5.7. 6J; 


此 函数 调用 将 产生 一 个 模拟 的 3 组 分 分 析 体 系 ,其 真实 旅 度 为 :[.3 2.67. BR 
simuld>[ cc.c.v_=kaltnfil(x.y); 
用 此 函数 调用 可 得 Kalinan 递 推 估计 解 系列 ,其 信息 系列 ,及 最 终 估计 сс. 


Check that matrix (x) and left hand side (y) have compatible dimensions 


[n,p]=sizeix); 


[nl,collhs 


ifn~=nl. 


sizeCy) 4 


error( The number of rows in Y must equal the number of rows in X. 2: 


end 


if collhs ~ -1, 
error CY must be a column vector. '); 
end 
[m,n J=size(x)+ 
% initialize p matrix and etimates с 
х1=1.2; 
000001; 
eC D=[0 00]; 
T=eye(3.3)5 
p=190 x ѕагт(г. / (х1 ж x1) x1 
X p=l 


% pause 


% recursive procedure 
for i=lim 
xi-xG. D. 
gape xi» (1/(xi'* p*xi+Tr)), 
уй) =уй) xi eG; 
eit) e(t gn GGD,; 
pz(—g*xi)*ps(I—g«xiD'c-gsr*g'; 
end 
сс=с 
plot (v) 
26. function [xig] —ridgecal(x y) ; 
函数 ridgecal 可 用 于 岭 回归 的 岭 迹 计算 来 估计 病态 分 析 体 系 的 回归 系数 。 
[971 


[rig] ridgecal (x у) з 


542 


输入 参数 ， 

x 是 一 个 人 nXP7 阶 校正 矩阵 ; 

y 为 一 mx1l) 阶 相应 矢量 。 

输出 参数 :rig 为 计算 所 得 的 岭 杰 , 其 中 进 人 平稳 状态 时 的 回归 系数 即 为 所 得 结果 。 


说 明 ,该 函数 可 用 下 述 模拟 例子 来 进行 检验 ， 


》[xl,y1]=simuld(3,[1 1 31],[25 25 35],[778],[.5.6.7],[35 36 20],[8 7.6 65.04.57 8105 
此 函数 调用 将 产生 一 个 模拟 的 3 组 分 病态 分 析 体 系 ,其 真实 浓度 为 :[. 5 .? OL n E REGES. 
[0. 2686 0. 9485 0. 5719]. 参见 simuld 


) [rig]==ridgecal(x1,y1); 
用 此 函数 调用 可 得 一 岭 迹 图 ,局 时 可 得 其 进 人 平稳 状态 时 的 回归 系数 为 ;[0. 5178 0. 6921 0. 5911] ,已 很 
PERLE. 
【程序 】 
% Check that matrix (x) and left hand side (y) have compatible dimensions 
[n,pJ=size(x): 


[nl,collhs]—size(y); 
if n—=nl, 
error (The number of rows in Y must equal the number of rows in X. 


end 


if collhs ~ =, 
error(’Y must be a column vector.) i 


end 


[m,n] =size(x); 
[s.v.d]=svd(x), 
startpoint=v4n yn) /200 
endpoint —v(n,n) 
(endpoint —startpoint) /100 
pause 
clear s d 
for і=1.101 
k=startpoint * i; 
rigli D) —inv(x! * xk ж eye([n,n])) #х' жуз 
end 
plot([startpoint; (endpoint — startpoint) /100 :endpoint J rig) + 
27. function [x ,dx ] —lscov(A b, V) 
函数 LSCOV sJ F B IE 0 OR ЖАН. 
IAF] 
GQ) X=LSCOV (А, B, V) 
输 人 参数 ， 


入 是 一 个 (Xp) PRERE, 

BX— пх1) 阶 相应 矢量 或 (nXd); 

V 为 量 测 误差 的 协 方差 短 阵 ， 通 常 为 对 角 短 阵 nxn); 

输出 参数 : X 为 计算 所 得 的 加 权 最 小 二 乘 估计 矢量 或 矩阵 (xD. 由 下 式 给 出 
X=inv (A' *inv (V) *A) *A'*inv (V) +В 

(2) [X,DX3=LSCOV(A.B,V) 

输入 参数 意义 同 前 ; 

输出 参数 ; X 为 计算 所 得 的 加 权 最 小 二 乘 估 计 失 量 或 答 阵 (bpX6) ,DX 由 下 述 式 子 给 出 

mse—B' * (inv(V) — inv(V) * A x inv(A' x inv(V) * A) * A x inv(V)) * B. /(m—n) 

DX =sqrt (diag Gnv(A' * inv(V) * А) * mse)? 


说 明 :该 函数 可 用 下 述 模拟 例子 来 进行 检验 : 


参见 SLASH,NNLS,QR. 
参考 文献 ， 
1 G. Strang,“Introduction to Applied Mathematics”, Wellesley-Cambndge,p. 398,1986 
2 F. Greybill, "Theory and Appheation of the Linear Model" Duxbury Press p. 207,1976 
【程序 ] 


[m,n]=sizet A): 


% Error checking 
if m <=n,error(’ Problem must be over—determined so that M > N. send 
if size(b, 1) =m, 
error sprint CB. must be a column vector of size Yd — by —1.' mi 
end 
if —isequal(size(V),[m m]), 
error (sprintf СҮ must be a %d—by— %d matrix. 'm,m2): 


end 


Eqnull.r]=qr(A)s 
q=qnull(:,1:n); 
r=r(linelinds 


qnul(;.1:n)=[J; 


g=qnull » V < qnull; 
feq x V x quil; 


c=q +; 
d—qnull' «b; 


х=г\(с—#* (8\00): 


if nargout = ==2 


% Standard formulas are: 
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% mse—b' » (inv(V) — inv(V) x A x inv(A' жубу) & A) # A sine (V)) * b. Am 一 no 
% dx =sqrt (diag inv CA" * inv(V) * A) ж mse)); 
U= (chol VD’; 
z=U\bs 
W=U\A; 
mse= (z #2 — x * W ж в) бас n); 
[Q,R1]=qr(W,0); 
ri (RNeye(n)); 
dx— Csqrt(sum(ri, * ri) * mse))”; 
end 
28. function [p,cun ]=pcer(x,c,numc,yun); 
函数 per 为 间接 校正 的 主 成 分 回归 方法 
【例子 】 
[p«cun]]-- pr Cx c nume yun); 
MASK: 
x 为 混 台 物 量 测 波 谱 矩 阵 ， 
c 为 相应 的 混合 物 浓度 矩阵 ; 
nume 为 应 取 的 主 成 分 数 ; 
yun 为 未 知 混合 物 量 测 波 谥 矩阵 或 矢量 。 
зней. 
p XE REBEREES ЕН И В, 
cun ЖЕЕ ЖЛ. By E ИЗНЕ БЕ Ж БЕ БТ БҮ Be X Nt 
% Check tha: matrix (X) and left hand side (y) have compatible dimensions 
Га,р]= sizeGO ; 
[n1 .collhs ]- size) + 
if n 一 一 al， 
error('The number of rows in Y must equal the number of rows in Х.')› 


end 


[s,v,d1=svá(x); 
poc dC Linume) * inv(vC] nume, 1 ;nume)) * s 1:numoe?' 
cun—p * yun; 
29. function [p,q,w,b,t,u,x,y ] — pls(a c, maxrank) 
函数 PLS 为 仿 最 小 二 乘 子 程序 
(AF) 
Q2. [P,Q,W,B]=PLS(A,C,MAXRANK) 
SASE ` 
A ЕРШЕ ЕЕ: 
C 38 FIT UL E iP ЕВЕ JE fi I ie Е Е 
MAXRANK 为 可 选用 的 最 大 主 成 分 数 。 
输出 参数 
P 为 量 测 矩阵 的 载荷 因子 矩阵 ， 
Q ARERIA E ERA A TER 
WAREER: 


B 为 内 部 相关 矢量 。 

(2) [P,Q.,W,B,T,U,X,Y]J=PLS(A,C,MAXRANK) 

BASH: 

A УРЕЙ ЖЕШИНЕ; 

СЯРА Е РЕ SR H ла A PE 

MAXRANK 为 可 选用 的 最 大 主 成 分 数 。 

输出 参数 ， 

P 为 量 测 矩 阵 的 载荷 因子 矩阵 ; 

Q 为 浓度 或 其 他 响 训 矩 阵 的 载荷 因子 矩阵 ， 

W 为 权重 矩阵 ; 

B 为 内 部 相关 矢量 ， 

本 为 量 测 短 阵 的 得 分 因 于 短 阵 ; 

U 为 浓度 或 其 他 响应 矩阵 的 得 分 因子 矩阵 ; 

X AEN RP : 

Y ay PAR BE sü Jt th Bi EAE Pe Ж Ж ЖОН РЕ. 

[EF] 
[myn 
[m= 


if nargin 一 一 3， 


ize (e); 


size(c); 


i min([n m maxrank ]); 
else i=min([r m]); 


end 


M%x=as 


A утс; 


for h=1:i, 
ху=х' * ур 
[pt ss .qt]--svd xy! x xy.0); 
а, D= D; 
wi hay ж qt(;,1))/sqrt(s(1,1)); 
t(.h)=x * wh) 
tsqr—tC(G 2D x teh); 


u(oh)=y * 90,103 
p(h.mtehY * x / tsqr; 
b(l,h)=(u(: h) * tG,hD / tears 


хех — (Ghd x phis 
у=у ~ bth) ж t(:,h) ж q.i 
end 
30. function [press,minlv ]= Tcvpls(X , Y ,maxnumb,selectnumb); 
函数 Tcvpls H FE MAR (cross-validation) И Ж, ЖЕ PF RAM PLS 于 程序 , 同 理 , 调 用 PCR 也 是 可 
行 的 。 
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【例子 ] 

[press,minlv = Tevpls(X , Y smaxnumb,selectnumb) ; 

输入 参数 

X АЗ BE (independent data matrixz), 在 间接 校正 中 即 为 混合 物 基 测 或 校正 短 阵 ; 
Y 为 因 变 量 矩阵 (dependent data matrix) ,在 问 接 校正 中 即 为 混合 物 浓度 夭 阵 ， 
maxnumb 为 用 户 给 定 的 最 大 主 成 分 数 ， 

selectnumb 为 用 户 给 定 的 每 次 训练 时 实际 要 做 到 的 主 成 分 数 ， 

输出 参数 

press 给 定 主 成 分 数 时 的 模型 预测 总 误差 (prediction error of squared sum); 

minlv 模型 预测 总 误差 最 小 点 ,用 以 决定 最 佳 主 成 分 数 。 


【程序 】 


[m,nj=size(X) ;maxnumb=rank(X);AA=selectnumb; 


HHH=[];TTT=[];PYR=[]; 


for k=1:m 
if k== 
XISX [2m]; 
Y1=Y [2m]; 25 


elseif k= =m 
X1=X([1:m—1]; >; 
Y1=Y([1:m—1].:3; 
else X1 —X([1;k— 1k 1:mT; 5 
Yi- YQ :ko 1,k-1;m]. 02: 


end 


for i=1:n 
for J=1:m—1 
X1Z(j,i)=X1 (j,i) —mean (XIL: i); 
end 


end 


Ү12=Ү1 —теапСҮ1); 
XX=X1Z; 
YR=Y1Z; 
W=[J:T=_J:C=[J;U=[J:P=[J:Q=[]:H=[]R=[]; 
for i=1:AA 
w=XX' * YR/sqrt(YR' * XX * XX' x YR); 
X^wi 
R'xt/G xt); 
u—YR *c/G' * e). 
p=XX' »t/G' «0; 
q—YR' x u/( жи); 


c 


xU D; 
X—t*p';YR=YR—b*t*c'; 


DDIW; 


CG aid =c; 

U(sD-u 

PC: i=ps 

QU. Das 
end 

HG, DWG, 1 sR=eye(n)— Wei LD) PCI); 
for j=2:AA 


HG. P=R* WGgn 
R=R ж (eye(n) —W(;,)) * PK: Os 
end 


HHH —[HHH H]; 
TTT-[T7T TJ 
end 


for k=1:m 


a=(k-1)# АА; 
pyr=(J: 


for h=1:AA 


Bp=HHH(.atdiath) * inv(TTT(: заа * TTT(;,a+1;a+h)) * HHHC ata tb)! x XIZ ж 
Y1Z; 
CC= (mean(¥1)—mean(X1) * Bp); 
Yrp=CC+X (ks) * Bp; 
pyr=[pyr Үгр)» 
end 
PYR=[PYR ;pyr]; 
end 
pressr=[]; 
press=[]; 
for i=] AA 
Y—PYRG D)! « (Y - PYRG DO; 


[pressscvr]s 


суг 


press 


end 
plo Cpress,'g') 
Epressr |, minlv ] —min (press) 
31. function [x,w]=nnls(E ,ftoi) 
BUR NNLS 用 于 解决 非 负 最 小 二 乘 问题 , 即 所 得 回归 估计 矢 最 为 非 负 矢量 。 
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【例子 】 
X=NNLS(A,b) 
BASE. 
全 为 一 个 taXp) 阶 校正 短 阵 ; 
b 为 一 (n>:1) 阶 相应 矢量 。 
输出 参数 :X 为 计算 所 得 的 加 权 最 小 二 乘 估计 矢 其 或 矩阵 (pXd) 。 
参见 LSCOV,SLASH. 
参考 文献 : 
Lawson and Hanson, “Solving Least Squares Problems”,Prentice-Hall,1974 
【程序 】 
if nargin<<2verror('Not enough input arguments. ') end 


if ~isreal(E) | ~isreal(f) ,error('A and b must be real.) send 


% initialize vanables 
if nargin < 3 
tol= 10 * eps * norm(E,1) * length(E); 
end 
[m.n]=size(E); 


P=zeros(1.n); 


Z=1:n; 
x=P', 
Z2-Z; 


w-—E'*(f-E tx); 


% set up iteration criterion 
iter=0; 


itmax=3 жп; 


% outer loop to put variables into set to hold positive coefficients 
while any(Z) & any(w (ZZ) > tol) 
[wit] = max (w (Z2) 


t=ZZ(t); 
Plt)=ts 
10=0; 


PP=find(P); 
ZZ=#ind(Z); 
naz=size(ZZ) | 
EP(1:m,PP)=E(; ,PP); 
EP(;  ZZ):=zeros(m,nzz(2)); 
z—pinv(EP) « f; 
z(ZZ) —zeros(nzz(2) nzz(1)); 
7^ inner loop to remove elements from the positive set which no longer belong 
while any(<z(PP) <=tol}) 


iter=iter + 1; 


if iter > itmax 
error([‘Tteration count is exceeded. ‘++ 
‘Try raising the tolerance. ']) 
end 
QQ = find((z <=tol) & P): 
alpha— min(x (QQ). /(x(QQ» — 209900); 
xx + alpha x (2 — х); 
ij=find(abs(x) < tol & P! — 0): 
Züp-i; 
Pj) —zerosC1 ,length Gj)); 
РР = find (P); 
ZZ =find(Z); 
nzz-size(ZZ); 
EP(1:m, PP) — EC: PP); 
EP(:,ZZ) —zeros(m ,nzz(2)) ; 
z=pinv(EP) * f; 
z(ZZ)= zeros(nzz(2),nzz(1)2; 


end 

x=z; 

w=E + (f= E xx); 
end 


32. function sida=m _ esti(x,y,iterNum); 
函数 m esti 为 稳健 的 M (АЖ. 
【例子 】 
sida=m _esti(x,y,iterNum); 
输入 参数 : 
x 为 一 个 tnXPp) 阶 校正 矩阵 ; 
y 为 一 (nX1) 阶 相应 矢量 ; 
iterNum WERK. 
输出 参数 ; sida 为 计算 所 得 的 稳健 估计 矢量 。 
【程序 】 
[n,mJ=size(x); 
sidal—inv(x' жх) «x ж y; 
sidal 
residu—y—x * sidal; 
plot(1:n,x x sidal, *'); 
pause 
t=lins 


plotct residu,' +°); 


residu 
median (abstresidu) ) 
for j=1:n 


if absCresidu (22 =1. 5 + median (abs (residu) ) 
residu(j) = 1. 5 * median (abs(residu)) * sign (residu (j); 
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else 


residu(j)=residu(j)+ 


end 

end 

residu; 
X for)=1l:n 
M if abs(residu())/(1. 5 * median(abs(residu))))< =3. 1416 
% weigts(j) = sin (residu(j)) /residu()) ; 
% else 
% weigts(j) =); 
ж end 
% end 


sida2=inv(x' x x) ж x' ж residu; 
sida = sida] —sida2; 
for k=1iterNurn 

resi=y—x ж sida; 


resi; 


ilias 

plot(t esi, 7) 

pause 

for j= jan 

if abs(resi(j) /median (absCresi) D) < = 3. 1416 

weigts(j)=sin (resi (j)) /resiC s 

else 

weigts<j) = Э› 

end 

end 

weigts + 

weeye(n); 

for i=lin 

wisi) =wegts(i); 

end 

sida—inv(x' # w x x) x x w x y 

plot(t,x x sida,’ x ' ty,'o ty," ЭҤ 

pause 
end 

end 

33. function [x,y]=simuld(numc,h1,cen] ,sgm1 ,h2,cen2 ,sgm2 noise,c) ; 

PU simulo 可 用 于 产生 白色 分 析 体 系 的 模拟 校正 短 阵 x 和 模拟 泥 合 物 确 应 矢量 y。 每 一 个 组 分 光谱 均 
由 两 个 高 斯 峰 所 组 成 ,而 模拟 混合 物 哆 应 矢量 y 则 由 给 定 组 分 数 (numc》 的 纯 光 谱 由 给 定 的 浓度 (ec), 通 过 线 
性 加 合 而 成 。 

【例子 ] 


(1) [х,у = simuld(numc,h1,cen1,sgm1,h2,cen2,sgm2,nose,c); 


输 人 参数， 


өз 
E 


nume 为 体系 的 组 分 数 ， 

h1 为 组 或 纯 组 分 光谱 的 第 一 个 高 斯 峰 的 峰 高 矢量 ( 行 矢量 ); 

cen] 为 组 成 纯 组 分 光谱 的 第 一 个 高 斯 峰 的 峰 位 置 矢 贡 5 行 入 量 ); 

sgm1 为 组 成 纯 组 分 光谱 的 第 一 个 高 斯 蜂 的 标准 偏差 矢量 ( 行 矢量 ); 

hz 为 组 成 纯 组 分 光 详 的 第 一 个 高 斯 峰 的 峰 高 矢量 ( 行 矢量 )， 

cen] 为 组 成 纯 组 分 光 详 的 第 二 个 商 斯 峰 的 峰 位 置 矢 嚼 5 行 从 量 ); 

sgm1 为 组 成 纯 组 分 光谱 的 第 一 个 高 斯 峰 的 标准 偏差 矢量 ( 行 矢量 ): 

noise 为 加 人 模拟 混合 物 啊 应 矢量 y 的 服从 正 态 分 布 的 误差 矢量 的 标准 差 ; 

c 为 包括 各 组 分 的 相对 浓度 的 矢 最 ( 列 向 量 ) 。 

输出 参数 ， 

x 为 包含 所 得 的 标准 纯 光 谱 的 (80Xnumc) 阶 的 校正 年 阵 : 

y 为 (80x1) 阶 的 模拟 混合 物 响 应 矢量 。 

(2) 使 用 示例 
fxl,y1]=amuld(3,[1 1 17.125 25 35],{7 7 81,-5-6- 77.085 36 50J.[8 7. 6 6],.04,[.5.7.6))+% 

【程序 】 
fori= 

for j=1:80 
xGa) —h1G) * expl ~ G—cen 1 i)" 2/(2 ж орта (1) 7 222 —h2(D x expl- (j -сеп2(1))^7/(7 * sgm2 

^20: 


:numc 


end 
end 


y-x*e 
y=y+randn([80 11) = noise; 
34. function [eig]=rafa(x,y,alf _ range stepwise); 
函数 rafa 为 一 简易 的 广义 秩 消 失 因 于 分 析 泪 . 其 结果 为 -- 对 数 特征 值 对 相对 浓度 系数 的 变化 图 .其 对 数 
特征 值 的 极 小 点 所 对 应 的 相对 小 度 系 数值 即 为 所 求 。 
【例子 ] 
{[еїд1=таїйабх,у,аН _range,stepwise); 
BASE. 
хаини: 
y 为 标准 物 的 二 维 量 测 矩阵 ; 
ali range 为 给 定 相对 浓度 系数 需 计 算 的 区 间 矢 量 ; 
stepwise 为 计算 步 长 。 
输出 参数 ;eig 为 计算 所 得 特征 值 矩阵 。 
【程序 ] 
seri— [alf _ range (1) :stepwise;alf _range(2)]s 
iternum=ceil( (alf _ range(2)— alf _ range(1)) /stepwise) ı 
[nym J=size(seri) 
if m>>iternum 
iternum =iternum + 1 
end 
pause 


cig L]; 
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for i=1,iternum 
Re=x—(alf_range(1) і stepwise) жу; 
[sd] vé (Re); 
eig ; D = diag(v(1:10,1:10)); 
end 
plot (seri log10 eig) ; 
35. function [kons ]=lorbm(X,S,C,rank) ; 
函数 lorbm 为 一 广义 秩 消 失 因 子 分 析 法 的 1.orber 方法 ,其 结果 为 混合 物 中 所 合 标 准 物质 相对 浓度 系 
ЖА. 
【例子 】 
[kons]=lorbm(X,S,C,rank);, 
输入 参数 ， 
ХВАТА ЕРЕ, 
S 为 标准 物 纯 光 谱 矢 量 ; 
C 为 标准 物 纯 色谱 矢量 ; 
rank 为 混合 物 的 二 维 量 测 矩 阵 的 化 学 秩 , 及 组 分 数 。 
输出 参数 kons 为 计算 所 得 相对 浓度 系数 。 
【程序 】 


function [kons]==lorbm(X,S,C,rank)s 


[U,Seig, VJ]=svd(X); 
Ured= UC; ,1:rank); 
Sred=Seig(1 rank, 1: rank); 
Vred— VC: ,1:rank); 
D —Ured * Sred > Vred’; 
a —Ured' « C; 
b= Vred' * S; 
M =a * b' x inv(Sred); 
Leigvekt ,eigval ]--eig(M) 
temp=sort (diag Ceigval)) ; 
eigval(1,1)=1 /eigval(1s1)5 
Kons= i /temnp (rank ,1) 
36. function [con ]]— rbl (x. y .ranky num, noise) 
BH ты 为 残 差 双 线性 分 解 算法 子 程序 。 
【例子 3 
[eon] 一 rbl(x ,yyranky,num ,noise) 
输入 参数 : 
x 为 含 待 测 的 纯 组 分 的 三 阶 矩 阵 , 即 xG ORRA k 待 测 组 分 量 测 矩 阵 中 第 1, 位置 上 的 量 测 值 ; 
у ЭЙЗИ ШИР; 
ranky 为 混合 物 量 测 和 矩阵 的 秋 ,或 混合 物体 系 的 组 分 数 ， 
num 待 测 纯 组 分 的 数目 ; 
noise 为 量 测 误差 ,用 作 程序 终止 条 件 。 
输出 参数 ,con 为 符 测 组 分 的 相对 浓度 ; 


[rx ex sb: size (x); 


[ry ey ]=sizeCy)s 


if сх 一 一 cy 


error(‘Requires the inputs to have the same number of columns. 2; 


end 


if rx ~=ry 


error Requires the inputs to have the same number of rows. ')+ 


end 


y _te=reshape(y sry * cy, 1); 


x _re=reshape(xyrx ж cx bx)+ 


b=lsq(x rey re 
pause 


Yealeulation of the initial residual matrix 
[kk] size (b) 
res0=y; 
for i=1:k—1 
res0 一 rs0 一 b(D & xCGiv iD; 
end 


(51, v1,d1]— зуй Gres) ; 


%calculation of the residual tolerance 


res. tol—res0— s1C; 1; Granky-num)) x v1(1; (ranky-num),1;(ranky-num))++ 


* dlG; 1: Cranky-num2) з 


поі = normtres _ tol) /15 


toll —05 
M pause 


tt=tol— toll; 

%comparison tol with the noise level 

whilett> =. 00001 & tol>noise 
res0=s1(. 51; (ranky-num)) x v1 C1; Ganky-num) 1: (ranky-num)) +++ 
ж d1(; li Ganky-num}) ; 


resi=y-res0; 


resi _ re==reshape (resi sry * cy, 125 


х _re—reshape(x,rx ж cx,bx); 
b=Isq(x _тезгез ге); 
[k,k1]=size(b); 


resi=y; 


E 
E 
© 
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for je 1:k—1 
resi—resi- bO) *x(;,: +j); 


end 


[sl v1, d1]-svdGresD ; 
гез tol —resi—sl Ci 1: Granky-num)) > v1 (1 : Ganky-num) 1  Ganky-num D «+ 
x dlC:, :(ranky-num))' ; 
tol] — rol; 
10l— norm(Gres | tol) /15; 
tt=toll — tol; 
% res0—s1C. L: Granky-num?) ж v1 (1: Cranky-num), 1: (ranky-num + 
% *dl1CGoliranky-num))'; 
pause 


end 


con=b(1;num,1) 
display ( program is finished’ ) 

37. function (bak1,bak2,bk1,bk2]=bakremo(action ,x) ; 

BR bakremo THT — £3 8 05 ЖЕП, WPS BW name 联合 使 用 .该 程序 提供 了 一 个 图 界面 
用 户 就 宣 接 用 鼠标 在 图 上 将 峰 徐 前 一 段 零 组 分 区 与 峰 炙 后 一 段 零 组 分 区 点 出 即 可 。 

【例子 了 

[bakl,bak2,bkl.bk2]—bakremo(aetion,x); 

输入 参数 : 

action Jj — E4688 84 ,一般 以 'start АШИ, 

x WIP UË ЕЕЕ. ЙОР БЕКЕ — G9 OE S — DOS — T Pci OR ER MER 
的 连续 时 间 记 录 , 等 ); 

输出 参数 : 

bak1 为 用 主 成 分 背景 扫除 方法 而 得 的 扣除 了 背景 的 数据 矩阵 (参见 文献 ) 在 程序 运行 过 程 中 , 按 下 
'BakSub' BRI , 

bak2 为 用 经 典 一 维 背 景 扫除 方法 面 得 的 扫除 了 背景 的 数据 矩阵 ,在 程序 运行 过 程 中 , 按 下 'ClaBC” 
即 可 。 

bk1 为 峰 化 前 一 段 零 组 分 区 的 背景 光谱 矢量 ; 

bk2 为 峰 簇 后 一 段 零 组 分 区 的 背景 光谱 矢 吓 。 


【程序 】 
X. possible actions; 
M “start” 
% 'clabc" 
M "еро 
М “remove' 
% “qui 


load datanames 
global BACKCORR _ DAT; 
global bak1; 


global bak2; 
global bk1; 
global bk2; 


af strenp(action, start’) 


% graphics initialization 


clf reset. 


set(gcf,’ Units’ ,‘normalized’ ,‘backingstore’ ,' off’); 


% Create initial plot 
[nsm]= size s 
max _nums=nj 
тах _nume=m} 
min nums—l; 
min _nume=1; 
утах =max(x); 
Wave 10; 
Time-10; 


baki=zeros(n,m); 

bak2=zeros(n,m); 

clabestr:=str2mat(['[bak1,bak2,bk1.bk2]—bakremol CCIaBC", "s 925 
clab: _ button —uicontrol (Style' ,' Pushbutton’ ,'Position' , [. 8726.12.07], 
"Units' ,' normalized" ;'Callback' «clabestr,' String! ，ClaBC ) ; 
removestr = str2mat ([' [bak „Бак? ,bk1.bk2']  bakremo! "remove", s 0, Di 

remove button—uicontrol (Style ,'Pushbutton' ,' Position ,[. 87 . 18 .12 077, 
"Units ‘normalized’ ," Callback ,removestr,'String' ,' BakSub') ; 
redostr—str2mat ([" [bak bak 2, bk1,bk2 ] —bakremol ("start",' s); 

repeat button —uicontrol Style! . ‘Pushbutton’ , Position ,[. 87 .1 .12 07], 
"Units' normalized" ,'Callback' ,redostr.' String’ Керо’): 

tr2mat ((" bakremol ("quit")! J); 


quitstr 
close _ button —uicontrol (Style! , Pushbutton’ ,'Position' ,Ẹ. 87 ,02 .12 .07].-+ 
"Units' ,' normalized’ ,’Callback’ .quitstr String ,'Quit') ; 


ах _chro=axes( Position ,[. 10 75 ,7 , 20]; 

Chro _line=plot(1;max  nums,mean(x ) ,'r' ,' EraseMode' ,'xor'); 
Maxis([ —8 8 一 .5 2D; 

grid; 

Stitle('ase mouse to select the desired zero-componenr regions to compare ); 
ylabel AD; 


xlabel Retention Time’); 


the first part 


en 
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[хх yy] +-ginput(2) 

low —floorG (122 
if low <1 

low=1, 
end 
high=ceillxx(2)) ; 
if high > n 

high 


end 


[uss,v]=svd x low high, :)); 
figure(1); 
[xx,yyJ=baz(low thigh x (low high Wave)» 
hold ons plot (xx,yy.'m')s 
bkl-vG.DesO Du; 
ах _ peal ==axes ( Position ,[. 10 . 25 . 30.357): 
pea _linet=-plot(1 ;max | numeyv(:+1:2),'EraseMode’ , xor )， 
hold ons 
рію] «тах _ nume v1), +; 


ylabel( Loadings') ; 
xlabel(' Wavelength’); 


uicontrol(‘style’ ,'text' ,'pos s[- 83 , 92 .16 085,77 
'Units' ,'normalized' ,' BackgroundColor' ,'black' ,--- 


"ForegroundColor' ,' white’ ,/String’ ,'EigVals 1,'); 


uicontrol 'style' ,'text' pos’ ,[. 83 . 87.16.05 J, 
"Units' ,'normalized' ,' BackgroundColor' , black' ++ 


'"ForegroundColor' ,' white" ,’String’ ,num2str(s(1,1))); 


uicontrol( style ,’text’ ,'pos [83 .82 .16 .05 ], 
‘Units’ ,/normalized’ ,' BackgroundColor’ ." black' , +++ 
'ForegroundColor' , white! ,'String' ,num2str(s(2,2))); 


uicontrol (‘style’ ,'text' ,'pos' ,[. 18 .08 .16 05], 

"Units' ‘normalized’ ,' BackgroundColor’ ,' black”, ++ 

"ForegroundColor' , white’ ,'String' ,” Rel :‘ »num2su (low) ,' = '. 
num2str(high) J); 


the second part 


ax chro—aexes( Position ,[. 10 .75 .7 . 20: 


Chro _line=plot(1:max  nums,mean(x 2 ,'y' ."EraseMode’ ，xor Y; 


Maxis([—8 8 — 5 2D: 
grid; 
Ме азе mouse to select the desired zero-component regions to compare"); 
ylab CA; 
xlabel Retention Time’); 


[xx1,yy1]=ginpur(2) 


low1=floor(xx1(1)); 


iflowl < 1 
low1=1; 

end 

high1 =ceil (xx1 2) 

if hight > n 
highl=n; 

end 


[usv ]=svd x low] high, 25 

bk2—v(.D ж CD x (1,1): 
figure(1)， 

[xx1,yyl]=barQowl:highl,x(lowl:highl,Wave)); 

hold on; plot(xx1.yyl./m')s 
xes ( Position” ,[. 55 . 25 , 30 . 35], XLim' [o 
YLim [7.5 2); 
pea _line2==plot(] тах _ nume.v(,-1,2),'EraseMode’ ，xor ; 
hold on; 


plot(1;max _nume,v(;,1) +°); 


ylabel( Loadings' ); 
xlabel( Wavelength’); 


uicontrol(’ style’ srtext ypos ,[. 83 . 70 .16 . 05] 
'Units' ,'normalized' ,' BackgroundColor’ ,'black' , ++ 
'ForegroundColor' ,' white" ,'String EigVals 2:0; 


uicontrol C style", text ,pos'[. 83 .65 .16 .05 Joe 
"Units! ,normelized' ,'BackgroundColor' ,' black”, +» 
"ForegroundColor' , white’ ,String’ snum2str(s(1,12225 


uicontrol( style" ,'text' ,'pos' ,[. 83 . 60 .16 .05 5, 
'Units' ,normalized' ,' BackgroundColor’ ,black’ , ++ 


'ForegroundColor' , white" ,"String’ ,num2str(s(2,2)2); 
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uicontrol Cstyle' , text pos ,[. 58 . 08 . 20 . 05], = 
"Units! ,'normalized' , BackgroundColor’ ,’ black” , +- 


"ForegroundColor' ,' white’ ,'String',[* Re2:' ,numzstr(low1),” ',num2str(high12]); 


bi—bki—min(bk1); 
b2=bk2—min(bk2); 
cong — bl! » b2/norm(b1)/norm(b2) ; 


vicontrol (style! ,'text' pos ,[. 25 .02 . 50.06], 
‘Units’ ,'normalized' ,’ BackgroundColor' ,' black' , ++ 
'ForegroundColor' , white’ ‘String’ [' Congruence coefficient.’ + 
num2str(cong) J); 


drawnow; 


BACKCORR DAT = [Waves Time; min nums; max _nums;min _nume; max nume: 0: O; == 


low shigh slow} chighl ]; 


elseif strep (action, remove" ) 


low=BACKCORR _DAT(9); 
high=BACKCORR _DAT(10); 
lowl=BACKCORR _DAT(1); 
highl=BACKCORR _ DAT (12); 

max  nums--BACKCORR _DAT(4); 
max  питс:= BACKCORR _ DAT(6)+ 
min nums--BACKCORR _ DAT(3); 
min, numc—BACKCORR _DAT(5); 
Wave BACKCORR _DAT(1); 
Time=BACKCORR _DAT(2); 


for j=low :high 
tia low + 1) =x (j, Wave); 


end 


for j= low] ;bighl 
tihG—lowl-- =x, Wave) 


end 


tiab=[tia tib]; 
rt 一 [low:high low1 :high1]; 


bb=lsq(rt',tiab'); 
b_est==bb(2)+bb(1) * (1 атах _ nums); 


b estb est 


coml-=bk1(Wave); 


com2==b _ est (low); 


сота =coml—com2; 


for i= 1.max _ nume 


for ) 一 1:max nums 


baklG.D = (5,1) Һ est() —bk1G)--b _est(low)+comd; 


end 


end 


elseif stremptaction ,'ClaBC' › 


low= BACKCORR _DAT(9); 
high 一 BACKCORR , DAT(10); 

low] =BACKCORR _ DAT (1); 

high] =BACKCORR _DAT(12); 

max _nums=BACKCORR РАТ): 
max _nume=BACKCORR _ DAT(6); 
min _nums=BACKCORR _DAT(3); 
min _tume=BACKCORR АТС); 
Wave=BACKCORR _ DATO); 

Time =BACKCORR _ DAT (2); 


for i=1;max nume 


for j7low high 
tia (S—low-- D xD; 


end 


for j=low] :highl 
tib(j—lowi + D-xGiD: 
end 


tiab 一 [tia tib]; 
rt= Поч :high low1:high1 ]; 


bb=Isq (rt stiab’) 5 
b_est=bb(2)+bb(1) * (1:max _nums); 


b_estl=b _ est’; 
bak2(: .0 = (11) —Ь estl; 
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end 
elseif stremp(action. ‘quit’ ) 
clear global ВАСКСОКК _ DATs 
delete (gef) ; 
delete datansme. mat; 
end 
38. function [puprof, puspec ]=als(x,pusini,iternum); 
函数 als 为 交换 量 小 二 乘 (alterative least squares) 子 程序 。 该 程序 在 选 代 过 程 中 提供 了 一 个 图 界面 HA 
就 直接 用 鼠标 在 图 上 将 光谱 或 色谱 中 为 焦 的 部 分 点 出 即 可 。 
【例子 】 
[puprof ,puspec ]=als(x,pusini) ; 
BAB 
x 为 量 测 二 维 数据 年 阵 ,其 每 一 行为 一 个 光谱 ,每 一 列 为 一 个 色谱 ， 
pusini 为 初始 选 代 光谱 矩阵 ; 
iternum 和 迭代 次 数 。 
输出 参数 ; 
puprot 计算 所 得 的 纯色 谱 矩 阵 ， 
puspec 计算 所 得 的 纯 光 谱 矩 阵 。 
【程序 】 
[m,nJ=size(pusini); 
puprof —inv (pusini x pusini) x pusini" + x; 


puspec=pusini; 
for i=1:iternum 


puprof=iny(puspec! * puspec) x puspec! * x: 


for j=1:n 
plot (puprof G, 22; 
disp Use the mouse pointer to mark the region which should be zeros) 
disp Mark the lower index first) 
01.02] = віпрше (2); 
low= floor(p1 12: 
if low <1 
low =1; 
end 
high=floor(p1(2)); 
if high > m 
high=m; 
end 
if high>low 
puprof(j,low ;high)=zeros([1 Chigh—low+1)2)s 
else 
end 


end 
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plot (puprof' ) 
pause 


elg 


puspec =x * puprof’  inv(puprof * puprof 2 ; 
for j=1:n 
plot (puspec( : ,j)): 
disp( Use the mouse pointer to mark the region which should be zeros‘ > 
dispC Mark the lower index first’) 
[p1.p2]— ginput(2) 
low-fleor(p1(1)2 
if low «1 
low-l: 
end 
high=ceil(p1(2)); 
if high > m 
high=m; 
end 
puspec ow :high, j) —zeros(L(high low +1) 1 D; 
end 
plot (puspec) 
pause 
clg 
end 
39. function [eig .eig1 ] —evol(x tim); 
AG evel 为 渐进 因子 分 析 子 程序 , 它 将 给 出 计算 所 得 的 前 10 个 特征 值 的 对 保留 时 间 对 数 变化 图 ,以 确定 
各 组 分 的 流出 和 消失 点 。 
IHF] 
[eig]—evol(x,tim); 
输入 参数 ， 
x 为 量 测 二 维 数据 矩阵 ,其 每 一 行为 一 个 光谱 ,每 一 列 为 一 个 色谱 ; 
tim 为 保留 时 间 矢 量 或 保留 时 间 方 向 的 点 数 矢 量 。 
输出 参数 : 
eig 前 癌 计算 所 得 的 每 一 时 间 点 所 对 应 的 前 10 个 特征 信 所 构成 矩阵; 
eigl 反 向 计算 所 得 的 每 一 时 间 点 所 对 应 的 前 130 个 特征 值 所 构成 答 阵 。 
【程序 了 
[m,nJ=size(x); 


elgt=zeros([m m]); 


calculation along with the forward direction 
for i=2:m 

[sv dio sd (xCl iis, 

tem= [diag (у) ;zeros([m—i,1])J; 
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eigt G, :)=eigt G, : Бет’; 
end 

eig— eig 41:104 

plot (tim ,logl0 (eigt: 1: 1000) 
xlabel Retention ütne’) 
yiabel( logi0(Eigvalues)' ) 
hold on 


%caleulation along with the reverse direction 
eigt=zeros([m m]); 
for i=m—ti--1:1 
Ís.v,d]—svd(xGiim, 2; 
tem = [diag(v) izeros [i7 1,10]: 
eigt (i, ;)=eigt (is :) + tem’; 
end 
plot (tim ,.logl0Ceigt C: ,1:10))) 
eig —eigt(: 1:10); 
xlabel( Retention time' ) 
ylabel log] 0(Kigvalues)') 
40. function [SS]=spe(X); 
BH spo 为 子 窗 口 因 子 分 析 方 法 子 程序 其 方法 的 基本 思路 和 算法 可 参见 第 七 章 。 
本 程序 提供 了 一 个 友好 界面 ,用 户 只 需 用 鼠标 定义 两 个 相 邻 多 组 分 区 域 , 旦 该 两 个 多 组 分 区 域 都 含有 一 
个 共同 组 分 , 则 可 得 到 该 组 分 的 纯 光 谱 。 
【例子 】 
[SS]=spc(X); 
输 人 参数 ;X 为 二 维 数据 矩阵 
输出 参数 ,SS 为 所 得 纯 光谱 。 


color— ['ymcrgbw" ], 
slutt=1; 
(n.m]=size(X)s 


mx —mean(X^); 


winsize:=input(' Please input the size of moving window '); 


for i= 
s—svd (X isi winsize—1,:))¢ 
eigs(j =s; 

jeje 


end 


— winsize- 1 


eigs —logl0(eigs) ; 
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end 

subplot( 212), plot (eigs) 
title Rank map? 
ylabel('Log(EV)')s 
xlabel С Retention time’); 


subplot (211) ,plot (mx); 


while slutt == 1 


disp(’ Use the mouse pointer to mark the suspected regions’) 


[x y]—ginputC) 


for 1 一 1:4 

if xG;<1 
xG;=1; 

elseif x(i)>n 
x =n; 

else 
xG) = ceeil(x(i)); 

end 


subplot(211) shold on; 
subplot(211) „bar (i mx G2 color 122 ; 
subplot (211) ,barj, mx G) scolor(2))5 


pause 
[E,s,v]-:svd(XG, D) [Fs v] 5d (X G, 205 
clear $ v; 

Е=Е(+,1:3);Е=Е(:›1:8)4 


[V,D]=eig(E' + F + F' x E); 
[v.d]—eg(F x E *E' * F); 
% decide which eigvector to use 
if d(2,2)>dQ.1) 
s=F tv2); 
else 
s=F # vl)s 
end 
if D(2,2)2>D(1,1) 
S=E+*V(,,2); 
else 
S-E* VG 1s 


end 
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s=[s SJ, 
T 
if max(s(; si) )<abs(min(s(; 402) 


fori 


si Dd)=—s(: ,i); 
end 
end 
figure (2) 
subplot (211) 
plots): 
title(num2str (DO 102); 
xlabel(num2str(D(2,2))); 
subplot (212) 
plot (s€ 41) --sC ,2)) sgrid 
clear EF VvdS 
answer input('Is this region OK? (1 =Yes, 0=No) '); 


if answer = = 1 
selind (k 
k=k+.; 
SS=[SSs(.,1)J; 

end 

delete figure(2)) 


slutt=input (‘Do you want to continue testing? (1= Yes, 0= Хо) i 


=[х(1) x€2) x(3) x(4)]; 


end 
41. function [pure]— OrthoproGO : 
函数 Orthopro WIE SERE AMT BP Кунанд, 
本 程序 提供 了 一 个 友好 界面 ,用 户 只 需 用 鼠标 定义 两 个 相 邻 多 组 分 区 域 , 且 该 两 个 多 组 分 区 域 都 含有 一 
个 共同 组 分 , 则 可 得 到 该 组 分 的 纯 光 谱 。 
【例子 】 
[pure ]=Orthopro(x); 
输入 参数 :x 为 二 维 数据 矩阵 。 
输出 参数 :pure 为 计算 所 得 的 纯色 谱 矩 阵 。 
EF] 
Numtotal=input(/Please input the number of components in the system: '); 
Num=Numtotal—1; 
[n;m]-size(x^ 
max nums—t, 
max numc—m; 
min nums—l; 
1; 


min numc 


winsize — input (Please input the window size of rank analysis; ^: 
j= winsize ; 


for i=1:max _ nums— winsize--1 


[uss,v]--svd(xGi—winsize— 1429); 


(diag(s))"; 


cons (j, 
j-)tli 
end 


cons =log10(cuns) ; 
kk=0 
slutt 一 3; 

while(slurt — ~1 & kk<Numtotal) 


figure(1) 
pl=plot(1:max _nums,cons); 

grid; 

title use mouse to select the desired regions to resolve’) ; 
ylabel(’ Log (Eige) y: 

xlabel( Retention Time’) ; 

[xx yy]-- ginpux c2) 

low —floor(xx (10), 


if low < 1 
low=1; 

end 

high cei (xx (2): 

if high > n 
high=n; 

end 


slutt] =input (‘Do you want to try to mark another region? (0=No,1=Yes) '); 


if slotti = 


figure(1) 

pl=plot(1:max _ nums ,cons); 

grids 

title(‘use mouse to select the desired regions to resolve ) ; 
ylabel (‘Log (EigsY ) : 


xlabel (‘Retention Time’); 


loor(xx (12 
if lowl <1 
lowl-l; 
end 
highl=ceil(xx (2525 
if high] > n 
hight =n; 


end 
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xab= (x (low :high, :);x(ow1 high , :2]; 
[u,s,v = svd (xab); 

re=zeros([max _nums,max _ numc_]) ; 
re=x—x * v( d; Num) * С, L: Num)’; 
else 

[ass v; — vd (x low high, 2i 
re=zeros({max _nums,max numc]; 


re=x—x куб: T Num) ж vC 1; Мит)"; 


end 

kk=kk+1; 
for К=1:шах _nums 
pure(k,kk)=sum(re(k,;)); 
end 


if sum ure ,kk)) «0 
pure(: skk) =—pure(; skk); 


end 


риге: kk) =pure(; kk). /norm (pure (; , kk) s 
figure(2) 
p2=plor({;max _nums,pure(; kk); 
hold on 


slutt =input ("Do you want to try to resolve another component? (0=No.1=Yes) '); 
end 
delete(p1) 
hold off 

42. function b—lsq(x,y) 

[LSU PU LE ZU LEX F. LEFT tb BHA. 

【例子 】 

b=lsq(x,y) 

输入 参数 ; 

x 为 一 (emXn) 阶 数据 矩阵 ; 

7 为 一 (mX1) 阶 列 矢量 。 

输出 参数 ,b 为 一 (nX1} 阶 的 列 矢量 , 即 计算 所 得 的 回归 系数 。 

【程序 了 
[m.n] 
% b=zeros(n+ 1); 


ize (xls 


aa=mean(x); 


һа =тлеал (y); 
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fori-iim 
xG, )—x(ü.:)—aa: 
уб) =уб) ^ bai 


end 


nv(x к) XX xy, 
s=ba—aa xb: 
b=[bis]s 


end 


43. function [x]=movpea (action , x ,in1) 

函数 movpca 可 用 于 动态 局 部 主 成 分 分 析 , 通 这 滑 动 条 即 可 对 数据 年 阵 的 任 -- 部 分 进行 闭 定 窗口 的 主 成 
分 分 析 。 
【例子 】 

[x J=məvpca (action, x,in1) 

влаж. 

action 为 一 字符 串 参 数 , 一 般 以 'start 代 人 即 可 。 

x 为 1 个 二 维 数 据 矩阵 ,该 卸 阵 的 每 一 行为 一 个 光谱 ;每 一 列 为 一 个 色谱 (或 一 注定 曲线 ,或 一 动力 学 系统 
的 连续 时 间 记 录 , 等 )。 

【程序 】 


% possible actions: 

% ‘star’ 

и "Сһап ах" 一 inl—1 ==> from slider, in1—2 == > from edit text 
и ‘ChanRet’ — inl => from slider 

% ‘redraw — inl=} ==> from Wave, inl=2 ==> from Time 

% ‘done! 

slutt=1; 


¥%{n m]=size(x); 


global BACKCORR РАТ 


if stremp ction , start, 
% graphics initialization 


Contr=input ( Please input the size of moving window: '); 


clf reset; 


set (gcf .Units' ,/ normalized" ,'backingstore' , ‘off’ ) ; 


96 Create initial plot 
[n,m]=size(x); 
max _nums=n; 


шах _ nume =m 


min nums-l; 


min _nume =15 
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ymax—max(x); 
Wave=10; 
Time=10; 


Wave _ text =uicontrol('Style’ ,'texi Position ,[. 18 .02 < 38 07], 7 
‘Units’ normalized! ," BackgroundColor’ ,' black’ , + 


"ForegroundColor' , white! ,'String' , Wavelength :'); 


uicontrolC style! ,"texi pos! ,[. 14 .07 , 02 .05 += 
‘Units’ , normalized ,' BackgroundColor’ , Баек”, = 


'ForegroundColor' , white! String ,num2str(min _ nume): 


uicontrol (‘st yle’ ,' text' , роз’ ,[. 74 .07 . 06 . 05 ` 
‘Units’ .'normalized' ,' BackgroundColor’ ,'black' , «e 


"ForegroundColor' ,' white" ,'String' ,num2str (пах _ numc)); 


Wave field —uicontrolC Style’ ,'edit' ,’ Position’ ‚L. 59 .02 .12 .07 ,+ 
"Units’ .normalized' ,'String' ;num2str (Wave) ,' Userdata' ,x "+ 


"CallBack' , movpca "Chan Wav") ,2) ипоурса Credraw",x 12525 


Wave slider uicontrol CStyle' ,'shder' ‘Position’ ,[. 15 .1 .6 . 04 
‘Units’ , normalized' , Value’ Wave, Max' max _ nume, Min' піп _ nums, UserData’ xy" 


"Callback! ,'movpca CChanWav",x .1) smovpca ("redraw" x1); 


uicontrol style s‘text’ ,'pos' ,[. 14. 65 .02 .05], 
"Units' .'normalized' ,/BackgroundColor’ ,' black! ++ 


'ForegroundColor' white! ,’String’ numZstr(min. nums)): 


uicontrol C style ,text' pos ,[. 90 . 65 - 06 .05 ], 
"Units' ;'normalized' ," BackgroundColor' Маск’ + 


'ForegroundColor' , white! String num?strGnax _ nums)) 


Ret _ slider —uicontrol Style’ /'slider' y" Position s(. 15 .7 ,75 ,047 ,°° 
"Units! , normalized! , Value! Time,'Max' max _ nums,'Min' „пип _ nums,'UserData' sx, 


‘Callback’ ,' movpca "ChanRet",x) ;movpea "redraw",x 2), : 


close button —uicontrol Style ,' Pushbutton’ ， Position ,[. 85 .02 .12 .07]. 


‘Units’ ,'normalized' ,' Callback' ,’ movpca ("done") ,’ String’ . Done’); 
subplot (222) plot (xC: ,10)) 
frequency domain 


ax _chro=axes( Position ,[. 16 . 75 .7 .20J); 


Chro line—plot(1:max nums,x(:,Wave) 'EraseMode' xor); 


Maxist[--8 8 —.5 2D: 
grid; 
ylabelt A0; 
xlabel(' Retention Time’) + 
Мах _pea(i) —zeros(Cont) 
Y%Chro _ line (1) = zeros(Contr); 
svd(x(10;10--Contr-1,:)); 


i==1:Contr 


[usevi 
Уот 
ах _ рса —axes( Position .[. 16.25.5. 35): 


pea lire=plot(1;max _nume,v(; «1 ;Contr) / EraseMode! хог): 
Yend 

ylabel A’); 

xlabel( Retention Time’); 
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if Contr= 
str1=[/EV1; ' ,num2strG (1.1 ]: 
str2— ['EV2, ' numZstr(s(2,2)) J 
str3=(" "J: 
elseif Contr>=3, 
str] = (EVI; ’ num2str(s(1 419]; 
str2— ['EV2; ' num2str(s (2.2) J; 
str3=("EV3, ' .num2str(s(3,322]; 
end 
str4— [' Region: ' ,num2str (Time) , —' »num2str(Time+Contr—1)]; 
uicontrol (style, text” pos ,[- 70 . 35 . 28 .05]，… 
"Units! ,' normalized’ ,/ BackgroundColor’ ,"blaek' . + 
'ForegroundColor' , white’ ,/ String’ ,str 1); 
vicontrol C'style' ,'text »'pos’,[. 70 28 . 28 , 05] 
‘Units! ,/normalized’ ,' BackgroundColor' , Маск’, +++ 


"ForegroundColor' , white! ,’ String’ ,str2)+ 


wicontrol style’ ,text' pos [. 70 . 22 .28 .05]，… 
'Units' , normalized ,' BackgroundColor’ ,black ‚+ 
'ForegroutidColor' ,' white’ , String’ ,str3)+ 

uicontrol (style ,'text' pos ,T.70 .42 .28 .05]，… 
‘Units’ normalized , BackgroundColor’ ,' black’ , = 
'ForegroundColor' ,' white’ ，String' »str4)+ 

%for i=1:Contr 

set (Chro _ line,’ ButtonDownFen’ ， ‘movpea¢"redraw”)' 2 ; 

Mend 


drawnow; 
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BACKCORR _ DAT = [Waves Time; min _numss max _ pums; min _nume; max nume, 0; O; ee 


ax _chro;Chro line: Wave field; Wave _ slider;Ret _ slider:ax _peaspca _ line;Contr]; 


570 


BACKCORR _ DAT(16) = Сопи: 
x=x; 

elseif stremp(action,' redraw’), 
Contr -BACKCORR _ DAT (16); 
ax1=BACKCORR _DAT(14); 
line _ hand] -BACKCORR _ DAT (15); 
ax=BACKCORR _DAT(9); 
line _ handie=BACKCORR _ DAT 10); 
max _nums=BACKCORR _ DAT (4); 
max _nume=BACKCORR _ DAT (6); 
Wave=BACKCORR _ DAT (1); 
Time=BACKCORR _ DAT(2); 
Time1— Time Contr-1; 
if Timel> =max _nums; 


Timel—max _nums; 


е== тах _ nums-Contr+ 1: 

end 

t 一 1:max nums; 

if (in1= =1) 

set(BACKCORR _ DAT (D) /'string! snum2str(Wave)); 
set(BACKCORR _DAT(12),/value’ , Wave) ; 


if (ax~=gea), 


axes(ax)+ 
drawnow discards 
end; 
Мах _chro=axes(/Position’ ,[.15 , 40 .5 26); 
Chro line =plot(t.x(,,Wave) ,EraseMode' ,'xor ); 
Waxis([—8 8 —.5 27); 
grids 
ylabel А’: ; 
xlabel Retention Time); 
else 
J6setCBACKCORR _ DAT (13) /'stting' »num2str(Time)) 5 
%set(BACKCORR _ DAT (10), value! , Time); 
if (axl~= gea), 
axes(ax1); 
drawnow discard; 
end; 
Dus, v] vd (x (Time; Timel , :)), 
Contr 
Time 
тах nume 


Yfor i=1;Contr 


Yax _pea=axes(' Position’ ,[. 16 . 24 .5 . 47) 
pea _line=plot(1:max _ nume sv : 1 :Contr),'EraseMode' xor) ; 
Kend 


ylabel A‘); 

xlabel(’ Wavelength’); 

if Contr= =2, 

strl=[ EV1; ' num2str(s(i,1)) ]; 

str2—[ EV2: ' ,num2str(s(2,2)) J; 

str3=[ h 

elseif Contr>=3, 

strl=[ EV1: ‘,numZstr(s(1,1))]; 

str2=[ EV2: ',num2str(s(2,2))J; 

str3=[ EV3; ',num2str(s(3,3)) J, 

end 

str4=[ Region: ' ,num2str(Time) , —' ,num2str (Time —Contr--1)J; 

uicontrol('style ytext ,'pos' ,[, 7035.28.05], 
"Units' ,' normalized’ ,’ BackgroundColor’ , black! ,--- 
'ForegroundColor' ," white! , String! str); 

uicontrol style! ,text' pos ,[. 70 28 , 28 , 05 jac 
"Units! ,'normalized' ,BackgroundColor' ,‘ black’ ++ 
"ForegroundColor' ,’ white’ ,’ String! ,str2); 

vicontrol style! ,'text' «pos ,[. 70 .22 .28 05], 
t Units! ,'normalized' ,"BackgroundColo:' ,’black’ , --- 
'ForegroundColor' , white! , String! str); 

uicontrol Cstyle' , text pos ,[. 70 . 42 . 28 . 057," 
‘Units’ ,/normalized’ ,"BackgroundColor' ,"black' , ++ 
'ForegroundColor' , white’ "String! ,str42; 


end 


drawnow; 


elseif stromp {action ChanWav/) , 
% хеде Wave _ slider," UserData') 


if (nl==1), % set from slider 
BACKCORR _DAT(1)=floor(get (BACKCORR _ DAT(122 ,'value')); 


else % set from edit text 
min _nume=BACKCORR _DAT(5)s 
max _nume=BACKCORR _ DAT(O ; 
Wave floor(str2num (get (CBACKCORR | DAT (11) /'string/ 20); 
if (Wave2>max _numc-1), 


Wave 一 max _ numc; 
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end; 

if (Wave<min _ nume -1)， 
Wave=min _ numc; 

end; 

BACKCORR _ DAT(D = Wave; 


drawnow; 


end 


elseif stremp(ac-ion ChanRet ) ， 


% х —get Wave _ slider,“UserData' ) 
min _nume=BACKCORR DATO); 


BACKCORR _ DAT(2)=floor(get(BACKCORR _ DAT C132 value )}; 
max numc—BACKCORR _ DAT(6); 

Contr =BACKCORR _ DAT(16; 

Contr 


drawnow; 


elseif stremp action , done!) , 
clf reset; 
clear global BACKCORR _ DAT 
delete(figure(1)9 


end 


end 
44. function name 
函数 пате 为 一 与 函数 bakremo, BK movpea Ж РИКИ, IE £ HLS OA 
Ж. A O E RURE Pe Sea aA BT 
【程序 】 
s=input(' Please input the name of matrix in the form of “name” ');save dataname s 
45. function [scores, loads, ssq, res] = pca (data, plots, scl, lv) 
函数 pca 用 于 主 成 分 分 析 计 算 。 
【例子 】 
[scores ,loads,ssq , res] = pca(data.plots.scl,lv) 
答 人 参数 ， 
data 为 二 维 数据 矩阵 ， 
plots 为 一 控制 参数 ， 
当 Pplots= 一 0 时 ， 将 抑制 任何 作 图 
当 plots 一 1 时 ， 对 作 图 无 限制 
当 Pplots 一 2 时 ， 对 作 图 有 最 制 ， 
sl 为 一 选择 性 矢量 参数 ， 以 对 因子 得 分 作 图 ， 
v 为 一 选择 性 标量 参数 ， 表 示 引 人 计算 的 主 成 分 数目 。 


输出 参数 ， 

scores; 为 主 成 分 分 析 所 得 的 因子 得 分 矩阵 ; 
loads. 为 主 成 分 分 析 所 得 的 因 于 载荷 矩阵 ; 
sq 为 方差 信息 ; 

res: MRAZE. 

【程序 】 


if nargin < 2 


plots = 1; 
end 
if plots > 2 

error (Plot option must be 0, 1 or 2) 
elseif plots <. 0 

error {' Plot option must be 0, 1 or 2') 
end 
[m.n] = size(data); 
focm 

cov = (data x data)/(m—1); 


Luvssv] = svdCcov); 
temp2 ln; 
esc] = lin: 


else 
cov = (data * data )/(m— 1); 
[u.s,v] = svd(cov); 
у = dau # v; 
fori = 1:m 
УС) = vGD/normGG Ds 
end 
temp? = 112m)‘; 
escl = lim; 
end 
temp = diag(s) * 100/(sum(diag(s))) ; 
ssq = [temp2 diag(s) temp cumsum (temp) J; 
‘A This section calculates the standard errors of the 
% eigenvalues and plots them 
if plots = = 
eigmax = ssq(:52)/(1— (1, 96 * sqri(2/m))); 
eigmin = ssq(: ,2)/ (1 + C1. 96 * sqrt (2/m))); 
ав 


plot(escl,ssq С: 2) ,esclseigmax ,' —b' vesclveigmin，- 


'›езс1+зз](:,20,'од') 


title("Eigenvalue vs. PC Number showing 95% Confidence Limits’ ) 


xlabel (‘PC Number’) 
ylabel (‘Eigenvalue’) 
elseif plots = = 


dg 
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plot (escl „вва С. +2) ,escl,ssq(: 12), "og') 
title (Eigenvalue vs. PC Number') 
xlabel('PC Number’) 
ylabel ‘Eigenvalue’ ) 
end 
5⁄4 Print out the amount of variance captured 
M dispC D 
*&disp( Percent Variance Captured by PCA Model. D 
disp D 
зр PCH Eigval %Var %TorVar') 
disp (seq) 
if nargin <4 


input( How many principal components do you want to keep? 


ly = ans; 
end 
fly >a 


error (No. of PCs must be <= no. of variables’) 
end 
if lv > m 
error No. of PCs must be <= no. of samples’) 
end 
X Form the PCA Model Based on the Number of PCs Chosen. 
los 


scores = data * loads; 


loads = vC 


I = eye(n); 
% Calculate tie standard error on the PC loadings if needed 
if plots == 2 
loaderr = zeros(n.lv); 
if n > m, an = mi else, nn = n; end 
fori = 1.19 
dif = (ssa(;, 2)-ones(nn,]) * seqCGi 2). 7 23 
dif = sort (dif); 
sig = sum((ones(nn—151) x ssq(i,2)). /dif C2:nn 12i 
loaderr(.,i) = ((ssa(i,2)/m) xloads(: 7 2) * sigs 
end 
loadmax = loads+loaderr ; 
loadmin = loads— loader, 
end 
% Calculate the residuals matrix and Q values 
Yresmat = ((I—loads * loads’) * data"); 
%res = (surn(resmat, ^ 2)2'+ 
M Create the scale vectors to plot against 
if plots >= 1.0 


if margin < 3 


x 


scl = 1:m; 


sellim = [1 m2; 


else 
scilim = “min(scl) max (scl) J; 
end 
sel2 = ] :ni 
temp = [11]; 
fori = lilv 


рейт = sqrt (s(i,1)) * temp x 1.95: 

plot (scl .scores(; i) sellim ,pelim ,"--b' ,sellim ,-pelim .'--b' ) 
xlabel(’ Sample Number) 

str = sprintf C Score on PCH р’); 

ylabel(s:r) 

tile Sample Scores with 95% Limits’) 


pause 
if plows == 2 
Plot (scl2 loadsC: 1) ysel2 ,loads(, +i) ,'og' sscl2 loadmax(, i), - b' scl? sloadmin(.i),’—-b’. [1 n2 [0 0.5 
elseif plots 1 
plot(ec|2,loads(; si) ,sc]|2,loads(; „i)s'og' ,El п],[00]) 
end 


xlabel(’ Variable Number’ > 

str = sprintf C Loadings for РСЯ Ya" iD 

ylabel (str) 

if plots = = 2 
str = sprintf(’ Variable # vs. Loadings for РСЯ Ир Showing Standard Errors’ .i); 
title(str 


else 


str = sprintf(' Variable Number vs. Loadings for PCH %g' i): 
title(str! 
end 
pause 
end 
end 


% Calculate Q limit using unused eigenvalues 
Jo x x x z x HER STRYG ME AU 
Vitemp = diag(s): 

Kiln < m 

% emod = temp(lv--1;n, 2i 

Меге 

% emod = temp(lv+1:m,:); 

mend 

ИІ = sum(emod); 

%th2 = sum (emod. ^ 2); 

УЗ = sumtemod. ^ 3); 
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Who = 1—((2 * th13 th2/( #0027 201 
“if ho <= 0.9 
“hO = .0001; 
YedispC ') 


YédispC Warning: Distribution of unused cigenvalues indicates that’) 


displ you should probably retain more PCs in the model. ') 
Kend 
Mq = tht * (CCL. 65 ж sqrt(2 x th2 x ВО" 2/1) — 1 — th2 s hu < (h= D/tb1^ 27 ҺО): 
ар ) 
displ The 95% Q limit is’ > 
“disp (q) 
if plots > = 1 
lim = Га 4]; 
plot (scl .tes «scllim limy--b 2 
str = sprint! ("Process Residual Q with 95 Percent Limit Based on vag PC Model , v); 
utle(str) 
xlabelt' Sample Number’) 
ylabel Residual ) 
pause 
end 
1⁄4 1⁄4 Calculate T ^ 2 limit using ftest routine 
jx ORO жож RR 
Mit lv > 1 
% if m c 300 


% tq = (lv * (m—J)/(m—1v)) * ftest © 95,300,1v,2): 
И else 

% (sq = (e * (m—1)/(m—lv)) * йез. 95.m—lyly.2)5 
% end 

% dispC 9 

% disp The 15% T^ 2 limit is’) 

% disp(tsq) 

% Calculate the value of T^ 2 by normalizing the scores to 

% unit variance and summing them up 


if plots >= 1.0 
temp2 = scores * inv(diag(ssq(1:lv.2). ^ 5025 
tsqvals = sum((temp2. ^ 2)')+ 
thm = [:sq tsq]; 
plot (scl, tsqvals ,scllim «tlm! --b/ 
str = sprintf ("Value of T^ 2 with 95 Percent Limit Based on 4g PC Model’ ,1 
title (str) 
xlabel( Sample Number’) 
ylabel( Value of T^ 29 
end 


else 


Ж dispC'T* 2 not calculated when numper of latent variables = 1°) 
tsq = 1.96 25 
end 


46. function [C,S ] —rescomp (X indices) ; 

HC rescomp NTE ЕЧЕИ ВЕНА BT AP BEEP 

BASS. 

x STI EU. 该 扼 阵 的 每 一 行为 一 个 光谱 每 一 区 为 一 个 色谱 OX BUE ЩА. 或 一 动力 学 条 
统 的 连续 时 间 记 录 ， 等 ); 

indices 为 包含 各 组 分 的 选择 性 区 域 的 起 点 和 

如 对 两 组 分 体系 有 indices= [14 18 43 49]. 

输出 参数 : 

C 为 包含 二 维 数据 阵 中 的 各 组 分 浓度 的 矩阵 : 

S 为 包含 一 维 数据 阵 中 的 各 组 分 纯 光 谱 的 矩阵 ， 

【程序 】 


numc =size (indices , 1); 


ME. 例 


for i=1 :nume 


C= Хж5 к шу(5' * S); 

47. function [C,S, Xred ]— respart (X ,indices ume): 

函数 respart 为 在 部 分 化 学 组 分 有 选择 性 信息 时 的 分 辨 程序 。 

BAS 

x AIP MORI. 该 矩阵 的 每 一 行为 一 个 光谱 : 每 一 列 为 一 个 色谱 (或 一 立定 曲线 , 或 一 动力 学 系 
统 的 连续 时 间 记 录 ， 等 ); 

indices 为 包含 各 组 分 的 选择 性 区 域 的 起 点 和 签 点 ,及 各 组 分 的 零 荣 度 〈 包 括 左 零 浓度 、 和 右 零 浓度 ) 的 
=й. Di. 

如 对 四 组 分 体系 ， 其 中 有 两 个 组 分 有 选择 性 信息 ， 则 有 

indices= [14 18 1 12 56 80 43 49 1 18 63 80] 
其 中 14 和 18 为 -个 组 分 的 选择 性 区 域 的 起 点 与 终点 ,1、12 和 56、80 分 别 为 其 左 零 浓度 和 右 零 浓度 区 域 .第 二 
行 各 数值 的 意义 同 此 。 

注意 ， 当 叶 一 组 分 只 有 一 个 零 浓度 区 域 时 ， 另 一 个 区 域 可 用 两 个 0 葵 代 。 

nm 为 被 分 大 体系 中 所 包含 的 化 学 组 分 数量 

输出 参数 ， 

CHAS HH PHSB EOE a 

S 为 包 售 二 维 数据 阵 中 的 各 组 分 纯 光 谱 的 矩阵 。 

Xred ЖЖ ЕД ЕИ Е, ИЕ] ATA BY ЭЕ NOIRE БЕЗЕ A A BO AR A ЕНЕ Е. 

【程序 】 

[n,mJ-—size(X): 


numa — size(indices 1) ; 


LT,P7—pca( X0, (1:2), nume? 5 
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for i=1,numa 


Ttes pe] = pea (X (indices (i +1) :indices(1,2) 0,0, 0:221): 
Т9 —zeros(n nume); 
e=zeros(n,1); 


k=1; 


for j= indices(i,1) indices i42) 
т? D =T); 
cGr-iedo: 
k-k Fl; 

end 


for j—indices 1, 3) sindices{i, 4) 
T2G, = T6: 2s 


end 


if indices 1.5) ~= 0 


for j—indices (1,5) indices 1, 6? 
T2G.2-TG. 05 
end 


end 


r—inv(12! * T2) + T2' wc; 
cpures7 T жг; 

CEC epure? 

S=(S ре], 


end 


Xred-X-C* S; 

48. function indices scoop (X); 

MR scoop 可 用 于 通过 特征 投影 图 来 找到 组 分 的 选择 性 信息 .这样 得 到 的 信息 可 用 于 下 一 步 的 分 辩 。 

输入 参数 : 

为] 个 二 维 炒 据 和 矩阵, 该 矩 隆 的 每 一 行为 一 个 光谱 ; 每 一 列 为 一个 色谱 (或 -滴定 曲 线 , 或 - -动力 学 系 
统 的 连续 时 间 记录 ， 等 )。 

输出 参数 ，indices 为 包含 各 组 分 的 选择 性 区 域 的 起 点 和 终点 的 矩阵 。 

【程序 】 

k=]; 


(nsm]=size(X); 
[T.P]=pca(X,0,(1:2),2); 


plc TG D TG42) 


hold on 

plor TC: ULT(:.2)，o0 
xlabel C РСТ + 

ylabel PCZ 

zoom 


slutt— ts 


=1) 


disp('Use the mouse to enter the start of the region of interest’) 


whileCslutt 


[x.y]-ginput (D : 
dist — 1е8; 
for i= lin 
newdist—norm([x y]—[TG,1) TG.22 D: 
if newdist «dist. 
dist —newdist у 
indi—i; 
end 


end 


disp Use the mouse to enter the last point of the region of interest’ ) 


(x .yJ-ginpatCD, 


dist = le8; 
for j=lin 
newdist =norm (Lx yJ—[TG.1) TO.2 s 


if newdist<dist 
dist =newdist ; 
ind2-j; 

end 


end 


if ind2<tind] 


q=ind]; 
ind1=ind2; 
ind2=q; 


end 


41 =norm([T Gndl, 1) T (indi ,2)}— [9 02); 
d2—norm([T Gnd2,1) T(ind2,2) ]— [0 0); 


if d]242 
усе= [0; Tind1 D]; 
vec2— [05 T (ind1. 22; 
else 


vec] = [0: T Gnd2,1)7 
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vec2 =[0;T(ind2,2) 1+ 


end 


linje =plo- (vecl rvec2 ,7'); 
pl —plotCT ind1,1) T ind1 22g +s 
p2=plot(TGnd2,1),T(ind2.2),'g #05 


answer =input (' True selective region? (0 = No, 1 = Yes 2 


if answer 一 一 1 
indices(k,1)=ind1; 
indices(k,2)=ind2; 
k=k+1; 


end 


delete (linje) ; 
delere(p12; 


delete(p2) ; 


slutt—inpatCDo you want to try to find another selective region? (07. No,1— Yes) '); 
end 
hold off 
49. function y=selnorm (x, thres); 
PAS selncrm JB ТА HE i a AT eR eR (k. DUR EE A eg. 
BABE: 
x LA =ОШ. 该 矩阵 的 每 行为 一 个 光谱 ; 每 一 列 为 一 个 色谱 (或 一 滴定 曲线 , 或 一 动力 学 系 
统 的 连续 时 间 记 录 ， 等 ); 
thres ИЕ, 
输出 参数 ， 
y 为 经 选择 性 标准 化 后 得 到 的 数据 矩阵 .可 直 搂 用 于 函数 seqrank 的 特征 结构 跟著 分 析 . 以 得 到 化 学 牧 图 
【程序 】 
[m,n]=size(x}; 
fori-lim 
if sum(x (i, :)) > —thres 
y Gcr x; D. /sum GG, 2) ж thres; 
else 
ys =x} 
end 
end 
50. function indices —segrank (X, noiselimit); 
BA seqrank 可 用 于 特征 结构 跟踪 分 析 , 以 得 到 保留 时 间 方向 的 化 学 秩 图 ,该 程序 据 供 了 一 个 图 界面 ,用 
户 就 直接 用 鼠标 在 图 上 将 可 能 的 选择 性 区 域 点 出 ， 程序 就 可 对 该 区 域 进行 计算 , 并 通过 对 话 , 要 用 户 确定 它 
是 过 是 选择 忻 区 域 ， -经 确定 ， 程 序 将 自动 将 该 区 域 计 下 。 
BASH. 


581 
x VT SE, AERE- HOY TOES Ж PLS — RR. 或 -动力 学 系 
统 的 连续 时 间 记 录 ， 等 ); 
noiselimit 为 白 定 义 噪声 水 平 。 
КЕРЕЙ 
indices 为 包含 各 组 分 的 选择 性 区 域 的 起 点 和 终点 的 第 阵 。 


【程序 】 


[n.m]=size(X); 


winsize —inp at Enter the size of the moving window '): 


j=1; 
slutt=1; 
color= C'ymcrgbw' ]; 


mx =mean(X'); 


foricl:n winsize 一 1 
[T.P. 
E-T'*T; 
їз], :) = (diag(E))'s 
jcjtli 


end 


pea (X Gi winsige-1, 2 40, (1:2) winsize); 


cigs 一 logl10Ceigs)， 


no=ones(1,n); 
no=no * noiselimit ; 
no=log10(no); 


vec (1 in); 


subplot (2112 , plot (mx) 

hold on 

subplot (212) , plot Ceigs) 

hold on 

Које = subplot (212). plot(vec sno.’ w); х 


zoom 


while slutt == 


disp("Use the mouse pointer to mark the suspected selective regions’ ) 
disp( Mark the lower index first’) 

[x.yj=ginput(2); 

low — floor (x (1)) ; 


iflow < 1 
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low=1: 
end 
high —ceilix(2)): 
if high > n 

high 一 : 


end 


Top] 一 p:aCXKiowihigh, ;)40.(1:2) +2): 


figure (2) 
plot (p) 
E= 


ety 
title (7 Tre first eigenvalue is ',num 2str(E(1,1))9) 


xlabel([ Second ‘ mumZstr(E(2,2)),' Noise: “,num2str(noselinit)”) 


answer = input (‘True selective region? (1 Yes. 0=No) "ЭУ: 
if answer == 1 
figure (1) 
subplot (211) „Баг (low ;high mx (low :high ) color (col >) 
col--col- 1s 
if col > 7 
col==1; 
end 
selinc(j, > 


1 


end 
delete (figure(2)) 
slutt =input Do you want to continue testing? (1= Yes, C—No) '); 
end 
51. function [simu, y, yl] =Simu2D 
函数 Simu2D Е С ES EH BEEF. Bul ЛЕЯ ES SER G IER RAY RAH 
式 来 输入 模拟 所 需 参 数 .每 个 光谱 由 两 个 高 斯 颖 所 组 成 .每 个 色谱 由 一 个 高 斯 蜂 所 组 成 。 
输出 参数 
simu 为 所 得 的 二 维 (100X100) 阶 的 数据 矩阵 ; 
у AAR MEE ДЖИНН; 
71 为 模拟 纯 组 分 色谱 矩阵 。 
【程序 】 
% This is a program to produce the simulation two-way data. The size 
% of the data matrix is 100 * 100 (simu). The chemical components in the simulated 
M system сап be up to six. The pure spectra of each component consist 
% of two Gauss peaks, while the pure chzomatographies of each component 
% consist of ore Gauss peak. The parameters of the Gauss peaks should. 


% be, therefore, input by the user. 
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% у= С;у1= 
3⁄4 Dept. of Chemistry, Hunan University. РКС. 
% By Yizeng Liang, 14/8, 1994 


ComNum=input('Please input the number of components in your simulation system : PH 
disp 9 
disp Now, you are asked to input the parameters of pure spectra!) 


for i-1:CoraNum 
Spei, 1) = input С Please input the peak position of the first Gauss реак(1—100): 5 


Spe (i.2) = input (° Please input the peak position of the second Gauss peak (1 — 100): D 
SpeGi, 3) =input Please input the standard deviation of the first Gauss peak(]— 30): "9; 


Spei, 4)=mput l Please input the standard deviation of the second Gauss peak(1— 30): D 


end 

disp E 

disp Now. you are asked to input the parameters of pure Chromatographies!"): 
disp э 


for i=1:ComNum 
ChrG, D —inputC Please input the peak position of the Gauss peak(1 —100): "Эз 
Chr(i, 2)—input C Please input the standard deviation of the Gauss peak(1--30); Ds 
end 
disp Now, you are asked to input the heights of pure Chromatographies! (0—1. 0) Э+ 
disp 9 
for i= 1 :ComNum 
mulG)=input С Please input the height of the Gauss peak (0—1); Ds 
end 
for i= 1:ComNum 
for ј=1.100 
yt joi) mult) * exp(— G- Chr 2^ 2/(Chr G2) 7 2205 
end 
end 
for i=} .ComNum 
for j=1,100 
у!) exp 6— G—Spelis 2 ^ 2/(Spe cin) © 2 * 22-4. 7 * exp ~ Ga SpeG,2)) 7 2/ (Spe D? 
2x2); 
end 
end 
simu zeros (100); 
simu=y * yl'; 
simu=simu+randn({100.100]) *. 0001; 
figure D 
subplot (221) ,plor (1:100,y) 
xlshel( Rezention Time’) 
subplot (222) ,plot(1:100,y1) 
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xlabel Wavelength") 

if ComNum 一 3 

plo=100 * ones (100,1); 

subplot (212) ,plot(7 100 0 100], [0 100 100 0],'о'› 
5р1 Sp2 Sd1 542 Cp Cd’; 

text (50,80,82); 


for i— 1:;ComNum 


51 — Parameter for component s 


引 一 cl， (ашты): — 'anum?su(Spe(.1)). 'onwmietr(SpeG,2)). — ' num2str(Speti. 
3). — ',num2str(pe(,4)), — '.num2su(ChrQ.D), — '.numZsrr(ChrG. 200] 

text(2el5 ж (7D esi 

end 

else 

plo: 100 » ones(100. 12; 

subplot (212) ,plot (Lo 100 0 100 ], 0 100 100 0]."0') 

52—'Spl 8р2 541 542 Cp Cd’; 

text (50,80,52) ; 

for i=1,ComN im 

s1—'Parameter for component! ; 

sl =[sl," ' ,num2ste(D V; ' num2str(SpeG, 12," 'numZsur(Spe(,23) ^ ! num2str (Spe U. 
3). 'snum2str(Spe(i,42), — '.num2su(ChrG.1)0. — '.num2srr(ChrG,2)5J; 

text(10.10+ (#-i),s1); 

end 

end 

pause(10) 

figure (2) 


mesh(simu) 
xlabel(’ Wavelength’) 
ylabelC Retention Tire) 
end 
52. % Zoom 2D xy 
函数 Zoom 为 作 图 缩放 功能 两 数 。 
[RF] 
AAAz= [++ 
"ТАААг,АААК — ginput 22; 
'axis([minCAAAr) maxCAA Ar) min(AAAk) max AAAIO D: 
‘clear AAAr АЛАК i]; 
AAAe=‘clf reset; clear AAAz AAAe АААа AAAzh AAAah AAAch ， 
AAAa='axis(“auto’) 1's 


AAAah = uicontrolC'style' ,'push' ,' units’ normal >+ 
‘pos’ [0 . 80 . 08 . 09 ] string" Auto call, AAAa): 


AAAzh = uicontrol C style ' push' s'unis’ «normal! 


un 
о 


‘pos [0.90 . 08 . 09], string , Zoom са ,AAAz): 


AAAeh = uiontrol Cstyle' ,' push’ y units’ v normal’, 
‘pos’ [0 . 70 . 08 . 09] string! U End’ call, AAAe): 
53. function class = classify (sample, training. group) 
PAR CLASSIFY 为 线性 判别 分 析 子 程序 。 
【例子 】 


class: 


ASSIFY (SAMPLE. TRAINING, GROUP) 

BASK: 

SAMPLE 为 待 分 类 的 样本 年 阵 ; 

TRAINING 为 已 知 类 别 的 训练 矩阵 

GROUP 为 已 知 类 别 编号 的 训练 矢量 。 

输出 参数 ， class 对 应 于 SAMPLE 的 每 个 样本 的 类 别 。 
【程序 】 


[ers gel ize(group); 


~=1 


if min (rege 
error (‘Requires a vector third argument, 2; 


end 


if ge ~= 1, 
group = group (o); 
рт = ge; 

end 


И any Cgroup—round(group)) | any(group) < 1 
error ("Tke third input argument must be positive integers. '): 
end 


maxg = max (group); 


[erste] = size (training) s 
ifr = gr, 
error (“The number of rows in the second and third input arguments must match’); 


end 


Tsr, sc] = size (sample); 
ifsc ~ = tc 
error (The number of columns in the first and second input arguments must ma:ch.'); 


end 


d = seros(sz maxg) s 

fork = 1: шах 
groupk = taming (find(group = = kii 
dG +k) = mahal (sample, groupk) ; 

end 
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tmp, class] == min(d'); 


class = class’: 


54. function d = mahal(Y, X); 
KC MAHAL 为 计算 Mahalanobis BS AS SI, 


【例子 了 

d = MAHAL (Y, X) 

输入 参数 : 

Y 为 样本 矩 降 或 矢量 ; 

X жери Жш, 

输出 参数 : d 为 它们 之 间 的 距离 。 
【程序 】 

size CX); 

[ry,cy] = sizet Y); 


rx sexi 


exce су 
error Requires the inputs to have the seme number of columns. `+ 


end 


if rx < cx 
error( The rumber of rows of X must exceed the number of columns. ')+ 


end 


m = mean(X); 

C = X—m(Xones(zx,1),:); 
IQR] = ar(C,0); 

R = R. /sqrt(=x 1); 

ri = R\eye(exsex)s 


d = sumlE. «Еу, 

55. function [center, U, obj fcn] = fem (data, cluster _ n, options) 
函数 FCM ЯЖИ K HERATA MT RATA. 
【例子 ] 

(1) [CENTER, U, OBJ _ FCN] = FCM(DATA, CLUSTER ММ) 

输入 参数 ， 

DATA HAE A AR 

CLUSTER _N 为 待 分 类 数目 〈 - 般 大 于 1)。 

输出 参数 ， 

CENTER 计算 所 得 的 类 中 心 矢量 ， 

口 为 计算 所 得 的 最 终 模糊 分 配 答 阵 (fuzzy partition matrix or MF matrix); 

OB] FCN 为 在 选 代 过 程 中 的 目标 哎 数 值 。 


(2) [CENTER, U, OBJ. FCN- 
输入 参数 ， 
DATA УЗЕНА ЕВЕ: 
CLUSTER _N 为 待 分 类 数 日 〈 一 般 大 于 1) 
OPTIONS 为 一 控制 聚 类 方法 进行 的 选择 矢量 ， 其 中 ，OPTIONS (1) 为 分 天 矩阵 的 指数 (exponent) 
HERA, LO 
OPTIONS (2); BAA (HEHEA: 100) 
OPTIONS (3), ERB REM CIE HUE: le- 5) 
OPTIONS (4): ECKE B SUR Kod Sd RH D: 1. 
输出 参数 : 
CENTER 计算 所 得 的 类 中 心 矢 基 : 
U 为 计算 所 得 的 最 终 模 糊 分 配 甜 阵 ; 
OBJ FON 为 在 送 代 过 程 中 的 目标 函数 伯 。 
使 用 示例 : 
› data = rard(100， 2); 
) [center, U. obj fen] = fem(data, 2): 
Y plot(data( . D datas 20, 7005 
) maxU = max(U)s 
y mdex1 = nd(U(d, :1) == maxU); 
) index? = find(U(2, :) == таку): 


у line(dataCindext, 1), dataCindexl, 2), ‘linestyle’. ' * сово, 'g)i 


FCM(DATA, CLUSTER N. OPTIONS) 


y fine(dataG@ndex2, 1), dataGindex2, 2), 'hnestyle', het, color, r); 
参见 INITFCM, DISTFCM, STEPFCM. 
[em 
if nargin — = 2 B nargin ~= 3, 
error Too many or too few input arguments! 2; 
end 


data size(data, 1); 


m_n = sedata. 2); 


% Change the following to set default options 

default options = [2; 3 exponent for the partition matrix U 
100; % max. number of iteration 
le—5; 94 min. amount of improvement 


1]; % info display during iteration 


2. 


options = default options: 


if nargin = 


else 
5 If "options" is not fully specified, pad it with default values- 
if leng h (options) < 4, 
tmp = default options; 


tmp(1 :length(options)) = options; 
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options == tmp; 

end 

% If some entries of "options" are nan's, replace them with defaults. 
D: 


nan index = find(isnan(options 
options(nan _ index) = default options(nan index); 
if opaons C.) < = 1, 
error( The exponent should be greater than 11; 
end 
end 


expo = options(1); % Exponent for U 
max ier = options(2); И Max. iteration 
min _impro = options(3); % Min. improvement 


display = opticns(42, % Display info or not 
obj_fen = zerys(max iter, 1); Ж Array for objective function 


U = inifem(custer n, data, m); % Initial fuzzy partition 

1⁄4 Man loop 

for i = limax iter. 
ГО, center, obj. fen(i) J = stepfem (data, О. cluster _ n. expo): 
if display, 


рип (Iteration count = % d, obj. fon = Ж fN, i, obj fen(i)): 
end 
3⁄4 check termination condition 
fi> 1, 
if absCobj fen(D —obj fcn(i—1)) < min impro. break: end. 
end 


end 


iter_n =i; % Actual number of iterations 
obj fenGter n--limax iter) = []: 
56. function U = initfcm (cluster. n; data n2 
函数 INIFOM 产生 模糊 长. 均值 聚 类 方法 的 初始 分 配 矩 阵子 程序 。 
[5/7] 
U ~ INITFCM (CLUSTER _N, DATA. ND 
输入 参数 : 
CLUSTER N 为 需 分 类 的 数目 ; 
DATA 样本 孝 据 矢量 数目 。 
BUSA: U 为 随机 产生 的 模糊 分 配 和 矩阵 ， 其 大 小 为 (CLUSTER _NXDATA _N)， 其 每 一 列 的 和 
Hl. 
参见 DISTFCM, STEPFCM, FCM. 
【程序 3 


U = rand (cluster n. data n); 


589 


col sum = sum (U); 
U = U. /eol, sum Cones (cluster n. 1), Di 
57. function [U _ new, center, obj fcn] = stepfcm (data. U, cluster. n, expo) 
函数 STEPFCM HMB K BERAI A hiki iW E 
【例子 了 
[U NEW, CENTER, ERR] = STEPFCM(DATA, U, CLUSTER _ N, EXPO) 
BASH: 
DATA f$ 535 AU PEAS SA HB PF s 
U: SURI RED 
CLUSTER N; 需 分 类 的 数目 ， 
EXPO: MA ROF PRM (> D. 
输出 参数 ， 
CENTER: 类 中 心 矢量 ; 
ERR: 模糊 分 关 的 已 标 函 数值 。 
参见 — DISTFCM, INITFCM, ЕСМ. 
【程序 】 
mf = U. ^ expo; % MF matrix after exponential modification 


center = mf * data. / ( (ones (size (data, 2), 1) * sum (mf'))'); И new center 


dist = distfem (center, data); % fill the distance matrix 
obj fen = sum (sum ( (dist. ^ 2) . * mf); % objective function 
tmp = dist. ^. (—2/ (expo—1)); % calculate new U, suppose expo ! = 1 


U new = tmp-/ (ones (cluster. n, 1) *sum (tmp): 
58. function out = distfem (center, data) 
BC DISTFCM 可 用 于 模糊 K HERA De PH RUS BÉ K BIS BJ EK ES (Euclidean) 
Ев. 
【例子 】 
OUT = DISTFCM (CENTER, DATA) 
SASK. 
DATA SHARE 
CENTER 为 类 中 心 矢量 。 
输出 参数 , OUT 为 计算 所 得 距离 , 如 OUT (1, DOS CENTER (1,:) У DATA G.) ZAKER. 
参见 INITFCM, STEPFCM. FCM. 
【程序 】 


out = zeros(size(center, 1), size(data. 1)); 
% fill the output matrix 


if size(center, 2) > 1, 
for k = Lisize(center, 1), 
out(k, :) = sqrt(sum(((data—ones(size(data, 1), 1) x center(k, :)). ^ 2)')); 
end 
else % 1—D data 
fork lisizeCcenter, 1), 


out(k, ;) = abs(center(k) ~data)'; 
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end 
end 
59. function [timeseri, y] —Rung _ kuta (x0, time range, stepwise); 
函数 Rung _ kuta 为 四 阶 Runge-Kutta 法 ; 
【例子 了 
[timeseri- y] =Rung _kuta (x0, time _ range, stepwise) » 
输入 参数 : 
хб 为 常 微分 组 的 初始 值 矢量 ; 
time _ range 为 积分 计算 区 间 矢量 
stepwise 为 积分 步 长 。 
输出 参数 
timeseri FE StH (LRA; 
y hy ZEER At [eg ВОЛЕ ИИО ШЕ. 
【程序 】 
[m,1] —size(x0); 
timeseri == [time _ range(1) .stepwise:time _ range ( 2)]; 


n=ceil((time _ range(2)-time | range(1) ) /stepwise) ; 
yG.D 7x0; 


for i=1:n 
0..1) = stepwise + dery (y G0); 
К: 2) = stepwise x дегу Суб: i) +stepwise/2 * КС: БУУП 
k(;,3)=5stepwise * dery Су: i) stepwise/2 * k(:,2)); 
k(,.4)=stepwise * dery Суб: 1) +stepwise X k( 30): 
yrit1 =y (D+ GG DTE2* kG2)72 *kG BI + kG: 400/65 
end 
size (timeseri) 
size(y) 
pause 
plot (timeseri’ -у 2: 
60. function [timeseri,y]=Adambm(x0, time _ range stepwise) ; 
函数 Adombm 为 求解 为 常 微分 组 的 初 值 问题 的 Adams ЖА 校正 方法 
【例子 ] 
[timeseri, y] =Adambm (x0, time _ range, stepwise), 
MABE. 
x0 HEAT RE 
time range 为 积分 计算 区 间 矢 量 ; 
stepwise 为 积分 步 长 。 
Hee: 
timesert 积分 时 间 序 列 ; 
y 为 在 积分 时 间 序 列 的 常 微分 组 的 解答 阵 。 
【程序 】 
yG,D-x0 


timeseri=[time | range(1) :stepwise time | range (2) Jš 
n=ceil((time _ range(2)-time | range(1))/stepwise): 
[tim,y J= Rung _ kuta (x0, [time _range(1) time _range(1} +4 * stepwise],stepwise); 
for i= 4in 
yG d D—yG D-stepwise x (2. 291666666 * dery (y (5D) - 2. 4583833 * dery(y Coi = D)e 
十 1. 841666666 * dery Cy Ci — 222—0. 378 * dery(y Gi 5005 
yGoic 1'—yG i) +stepwise * (0. 375 х dery Gy; i +1) + 0. 79166666 x dery (y CDD 
— 0, 2083332333 x dery (y C: i — 13) 4- 0. 04166666666 * deryCy i 2222: 


end 
size timeseri ? 
size(y) 
pause 
plot timeseri' y 2$ 
61. function [timeseri,y | Hamming(xO,time | range .stepwise) ; 
函数 Hamming 为 求解 为 常 微分 组 的 初 值 问题 的 Hamming 定 步 长 方法 ， 
171 
Ctimeseri.y]=Hamming(x0,time | range stepwise) ; 
BASE. 
x0 为 常 微分 组 的 初始 值 矢量 ， 
time _ range 为 积分 计算 区 间 矢 量 ， 
stepwise 为 积分 步 长 。 
输出 参数 。 
timesezi 积分 时 间 序 列 ; 
y 为 在 积分 时 间 序列 的 常 微分 组 的 解 矩 阵 。 
【程序 】 
yGD-x0 
timeseri [time _ range(1) :stepwise:time _range(2)]; 
n—ceil((time _ range(2)-time | range (12) /stepwise) ; 
[timsy]—Rung kuta(xO.[time range(1) time range(1) +5 * stepwise] stepwise) ; 
iGD-D OF; 
for i=5:n 
©(:,1)= (9 к yGui—1)—yG ri 3) +3 * stepwise # (dery (rt; ,1)) +e 
2 x dery(y(, i 1) —dery(yG i—2))))/8; 
рб. s1)=:¥(; i 4) +8 * stepwise € (dery (y Ci ,1—1))+ dery(y (5,4730) 
—0, 5 * dery (yC: i 202/81 
pG 2) ey, i —3)+4 8 х stepwise * (dery (yC: D) E derg(y (i7 2) 
—0. 5 * dery (y C41 71)2/85 
т(:,2)=+р(1,2)—112/121 * (pG 4D) 7065101 
c(,,2)— (9 < у. D) —y Gi 2) 4-3 ж stepwise * (dery(z (i20) - 2  dery(y Ci 00 
—dery(Gy G i—1))))/8; 
yGoid D =el: 2+9% OG 2) — el 2/121; 
cla DeC: 2), 
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end 

size (timeseri) 

size(y) 

pause 

plot tirmeseri' y’); 
62. function f=dery (y) 
BM dery 为 定义 一 个 党 微分 方程 组 的 调用 函数 。 
该 函数 定义 了 下 述 微分 方程 ， 


dyl/di—y2 
dy2/dt= —yl 
所 以 ， 根 据 不 同 的 函数 ， 应 有 不 同 的 dery BH. 
EF] 
[m,n]=size(y); 
fO)=y02; 
i -yO» 
=f; 


63. function [tout,yout,o3,o4,o5,o6] = ode45(odefile,tspan,y0,options,varargin) 
函数 ODE45 Whee TE BILE A fk ¿r АОИ P) ER 038 ИЕЛЕ. 
了 例子 
(D [TY] = ODE45CF',TSPAN,Y0) 
输入 参数 ; 
TSPAN 为 积分 计算 区 局 矢 量 ， 如 TSPAN = [TO TFINALJ: 
Yo 为 常 微分 组 的 初始 值 矢量 ; 
TA BESTE 为 定义 一 个 常 微分 方程 组 的 调用 函数 ， 
输出 参数 : 
T 积分 时 间 序 列 ， 
立 为 在 积分 时 间 序 列 的 常 微分 组 的 解 矩 隆 。 
使 用 示例 ， 
D 先 用 M 文件 定义 一 个 常 微分 方程 组 的 调用 西数 vdpol (т, x): 
function xdot=vdpol (t,x); 
xdot(1)=x{1) ж (1—х(2). ^ 2) —x(23; 
xdot(2)=x(1); 
xdot=xdot' ; 
将 此 函数 存 为 M X PF, 
2) 继 用 下 述 步骤 来 调用 函数 ode45， 并 将 结果 在 屏幕 上 显示 : 
>t0=0; 
1220; 
>x0=[0. 25] 
> [tx 1=ode45(vdpol , [t0 :£],x0; 
>plot(t,x) 
(2) LT,Y] = ODE45CF',TSPAN.Y0,OPTIONS) 
RASK. 
TSPAN 为 积分 计算 区 同 矢量 ， 如 ТРАМ = [ТО TFINAL]; 
Yo 为 常 微分 组 的 初始 值 矢 量 ; 


字符 串 参数 F ELAR M A EHNA: 
OPTIONS 为 选择 参数 集 。 
输出 参数 : 
T 积分 时 间 序 列 ; 
Y 为 在 积分 时 间 序 列 的 常 微分 绝 的 解答 阵 。 
使 用 示例 : 
1) OPTIONS 可 由 下 述 函 数 调用 得 到 : 
> OPTIONS = odeset(’RelTol , le- 4, AbsTol' ,[le 一 4 le—4 1e: 352; 
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在 此 ; 字符 串 参 数 'RelTo 表示 相对 误差 要 求 (relative error tolerance) ЇЙ A le— 45 


字符 串 参 数 "AbsTol' 表 示 绝 对 误差 要 求 《absolute error tolerance), 对 一 个 
PRAHA [le 一 4 le -4 1e—5]. 
D 用 M 文 件 定义 一 个 常 微分 方程 组 的 调用 随 数 vdpol (t, x): 
function xdot = rigidode(t, x); 
xdot(1)=s(1) + (1—x(2), ^ 2)—x(2); 
xdot(2)=x(1); 
xdot(3)= --х (2); 
xdot=xdot' ; 
Wik BRM 文件 。 
3) 继 甲 下 述 步 又 来 调用 函数 cde45， 并 将 结果 在 房 幕 上 显示 : 
>t0=0; 
>t{f=20; 
>x0=[0. 251 
>[t,x]~ ode45 (rigidode’ ,[t0 tf],x0,OPTIONS); 
Zplot(t,x) 
【程序 】 


true — logical(1); 


false = —true; 


nsteps = 0: И stats 
nfailed = 0; % stats 
nfevals = 0; M stats 

% stats 
ndecomps = 0; % stats 
nsolves = 0; % stats 


if nargin === 0 

error (Мот enough input arguments. See ODE45.'); 
elseif ~isstr(odefile) & ~isa (odefile , "inline? 

error( First argument must be a single— quoted string. See ODE45. D: 
end 


1 
Ui yo = Cli options — Ds 


if nargin 


tspan 


elseif nargin = = 2 


三 阶 常 微 分 组 中 的 三 个 数值 积 
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yO = []; options = [7: 
elseif nargin = = 
options = []; 
elseif ~isempty (options) & ~isa (options, ‘struct’ ) 
if (length (tspan) = = 1) & (length(y0) == 1) & (min (size (options) > 
tspan = [tspans y0]; 
уб = options; 
options = []; 
varargin = {}; 
msg = sprintf C Use oded5("%s",tspansy0,-) instead. ' ,odefile) : 


warning([/Cbsolete syntax. ' msg]); 
else 

error Correct syntax is ode45 ("odefile”stspan ,y0 options), "Эз 
end 


end 


if isstr(odefile) & (exist(odefile) == 4) И a SIMULINK model 
warning({/Future versions of this M—file will not support ‘+ 
'SIMULINK models. Use the SIM command directly. ' 7); 


options=simsct(’ Solver’ ,'ode45' „+ 
"InitialState! , уб, 
'RelTol' ,odeget options, Rel Tol) = 
'AbsTol ,odeget (options, AbsTol ) +=: 
Refine! sodeget (options »/Refine’ ) , += 
‘MaxStep’ ,odeget (options, ' MaxStep! ) "+ 
‘InitialStep' ,odeget (options , InitialStep')); 


У The code before and after the cell to sim copies the ToWorkspace 
% variables to the caller workspace. 

У Note: we must use unique variables names at this point to be 

% distinct from ToWorkspace variable names. 

odefile _ cp2wissp = odefile; 


[tout _ cp2wksp „yout _ cpZwksp.o3 cpZwksp] = 


sim (odefile ,tspan options, varargin { : }); 


% Copy ToWorkspace variables to the caller workspace. 
names _ cp2wksp = 
find _ system (odefile _ cp2wksp,‘LookUnderMasks’ ,'on' y 
'BlockType' , "ToWorkspace') : 
for cp2wksp = lilength(names _ cp2wksp) 
varname _ cp2wksp = get peram(names cp2whspli cp2wksp],"- 
"VariableName’ ) ; 


assignin(‘caller’, varname _ cp2wksp, eval(varname cp2wksp))+ 


ae) 


end 
М Now safe to use tout, yout, and o3 


tout = tout cpZwksp; yout — yout _cp2wksp; 03 = o3 cp2wksp; 


return; 


end 


Ж Get default tspan and уд from odefile if none are specified. 
if isempty (tspan) | isempty(y0) 
if (nargout(odefile) < 3) & (nargout(odefile) ~= —1) 
msg = sprintf C Use ode45("%s” tspan ,y0, =+) instead. ’ ,odefile); 


error(['No default parameters in ^ upper(odefile) '. ' msg 


end 


[def _ tspan def _y0,def options] = fevalCodefile, ].[.],' init! varargin1: 


if isempty (tspan) 
tspan = def tspan; 
end 
if isemptyCy0) 
yO = de уй; 
end 
if isempty (options) 
options == def options; 
else 
options = odeser(def _ options, options); 
end 


end 


% Test that :span is internally consistent. 
tspan = tspan(:)+ 
ntspan = length (арап); 
if ntspan == 

10 = 0; 

next = 1; 
else 

t0 = tspan(1); 

next = 2; 
end 
tfinal = tspan(ntspan); 
if 10 = = tfinal 


error('The last entry in tspan must be different from the first entry. 2; 
end 


tdir = sign(tfinal - 10); 


if any (tdir * (tapan (2;ntspan) —tspan(1 -ntspan--1)) < = 0) 


error ( The entries in tspan must strictly increase or decrease, ° ) ç 
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end 
t= tO; 
у = y0G); 


neq = length(y); 


% Get options. and set defaults. 
rtol = odeget (options, RelTol' ,le— 3); 
if Clength(rtol? 一 一 1) | (ol <= 0) 
error('RelTol must be a positive scalar. 2; 
end 
af rtol < 100 * eps 
rtol = 100 ж eps; 
warning ([' RelTol has been increased to ° num2str(rtol) '. D: 
end 


atol = odeget (options, AbsTol’ ,le— 6); 
if any(atol <== 0) 
error (' AbsTol must be positive. ') ; 


end 


normcontrol = strcmp(odeget (options, NormControl soff )，on ) 
if normcontrol 
if length (atel) ~ = 1 
error (‘Solving with NormControl "on" requires а scalar AbsTol."): 
end 
normy = norm); 
else 
if (length (ato) ~= 1) & Пепе бако) ~ = neq? 
error (sprintf (['Solving Vis requires a scalar AbsTol, "=+ 
'or a vector AbsTol of length 区 中 ],upper Codefile) neq); 
end 
atol = atolt i9; 
end 


threshold = atol / rtol; 


3⁄4 By default, hmax is 1/10 of the interval. 
hmax = min(abs(tfinal—1), absCodeget (options ."MaxStep’ ,0. 1 * (final 7002: 
if hmax <= ) 
error(’ Option "MaxStep" must be greater than zero. : 
end 
htry = absCodegetCoptions,' InitialStep 2) s 
if htry <= 0 


error (C Option "InitialStep" must be greater than zero. '): 


end 


haveeventiun — stremp(odeget (options Events! "off! гоп 2$ 
if haveeventfun 

valt = feval(odefile,t.y.'events' .varargin} :}) 

teout = [14 


yeont = [J]; 


ieou = | 


end 


if nargout > 0 
outfun = »deget(options,' OutputFen 2: 
else 
outfun = odeget(options;' OutputFcn' ,“odeplot ) ; 
end 
if isempty (outfun) 
haveoutfur = false; 
else 
haveoutfur. = true; 


outputs = odeget (options + OutputSel' .1:neq); 


end 
refine = odeget(options,/Refine’.4); — 94 Necessary for smooth plots. 
printstats = strcmp odeget (options ‘Stats’ ,‘off’) on); 


if stremp Codeget (options ,’Mass’ ,‘ off’) ,'on') 


error ('Solser does not handle mass matrices. M * y' '. See ODE15S or ODE238.')+ 


end 


% Set the output flag. 
if ntspan > 2 

outflag = 1; % output only at tspan points 
elseif refine «<<= 1 

outflag = 2; У, computed points. no refinement 


else 


outflag = 3; % computed points, with refinement 
S = (1:гейпе~ 1)' / refine; 


end 


% Allocate memory if we're generating output- 
if nargout > 0 
if nispan >> 2 % output only at tspan points 
tout = zeros(ntspan,1); 
yout ~ »eros(ntspan,neq) ; 


else М alloc in chunks 
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chunk = max(eeil(128 / neq) refine); 
tout = zeros(chunk,1); 


yout = zeros(çhunk,neq); 


end 
nout = 1; 
tout(nout) = t; 


yout(nout,,) = 


end 


% Initialize method parameters. 


pow = 1/5: 

A = [1/5; 3/10; 4/5; 8/94 1s 1]: 

Be[ 
1⁄5 3/40 44/45 19372/6561 9017/3168 35/384 
0 9/40 一 56/15 —25360/2187 — 355/33 0 
0 0 32/9 64448/6561 46732/5247 500/1113 
0 9 0 — 212/729 49/176 125/192 
0 0 0 о —5108/18656 — 2187/6784 
0 0 0 9° 0 11/84 
0 0 0 9 0 0 
J: 


E = [71/57600; 0; —71/16695; 71/1920; —17253/339200; 22/525: —1/40]; 


Í = zeros(neq,7); 


% Maintain backward compatibility with ODE files that don't accept flags. 
if isempty (varargin) 
args = (s 
else Ж There are extra arguments. so 
args = [{[]} varargin]; И stick an empty flag on the front 
end % before sending them to odefile. 


f0 = feval(odefile ty args: 2; 


nfevals = nfevals + 1; % stats 
[m,n] = size(f0); 
n1 


error [upper Codefile) ' must return а column vector. ' J) 

elseif m ~= neq 
msg = spriatf(’an initial condition vector of length J4d. ' m): 
exror([’Solving ^ uppar (odefile) ^ requires” msg; 


end 


hmin = 16 * eps * abs(t); 
if isempty (hury) 


% Compute an initial step size h using y (t), 


absh = min(lunax, abs(tspan(nexr) — 12}; 
if normcontro] 

rh — (norm(f0) / max(normy threshold) / (0.8 * rrol” pow); 
else 


rh = norm({0. / max(abs(y), threshold) ,inf) / (0. 8 * rtol ^ pow); 


end 

if absh x th >> 1 
absh = 1 / rh; 

end 


absh = max!absh, hin); 
else 

absh = min(hmax, max(hmins htry)) ; 
end 
ÍG.D = f0; 


% Initialize the output function. 
if haveoutfun 
fevalCoutfun s [t tfinal] y Coutputs) , init’); 


end 


% THE MAIN LOOP 


done — false; 


while ~done 


Ж By default, hmin is a small number such that t-- hmin is only slightly 

% different than t. It might be 0 if t is 0. 

hmin = 16 * eps * abs(t); 

absh = min(hmax, max(hmin, absh)); — 94 couldn't limit absh until new hmin 
h = tdir * absh; 


56 Stretch the step if within 1056 of tfinal—t, 
И 1.1 * absh >= abs(tfinal — t) 
= tfinal — t; 
absh = abs(h); 
done = true; 


end 


Ж LOOP FOR ADVANCING ONE STEP. 


nofailed = true; % no failed attempts 
while true 

hA = h* As 

hB = he B; 


16,2) = feval(odefile, t + hA(OD, y + f* hBG.D, argsi: O; 
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{(.,3) = feval(odefile, t + ҺА (2), у + f£ hBG 2). argsi cis 
4444) = feval(odefile, t + HAG), у + f=bBC;,3). args! iD s 
f(,5) = fevalCodefile, t + hAGD, y + E hBG 4D, args iD 
10.56) = feval(odefile, t + hACS), y + Í* HBC. .5)4 argstiD s 
tnew — t + hA(6); 

ynew = y + iz hB(:,6); 

C267) = feval(odefile, шеме ynew, args{: 1); 


nfevals = nfevals + 6; И stats 


% Estimate the error. 
if normconrrol 
normynew = norm(ynew); 
err = absh * (norm(f * E) / max(max(normy .normynew) threshold) y 
else 
err = absh * погт( *E)./ max(max(abs(y) ,abs(ynew) ) «threshold) sinf); 
end 


% Accept the solution only if the weighted error is no more than the 
% tolerance rtol. Estimate an h that will yield an error of rtol on 
Y the next step or the next try at taking this step, as the case may be, 
% and use 0. 8 of this value to avcid failures. 
if err > rtol % Failed step 
nfailed = nfailed + 1; И stats 
if absh <= hmin 
msg = sprintf (['Failure at t = %e. Unable to meet integration ' ^ 
"tolerances without reducing the step size below ‘++ 
‘the smallest value allowed (Ме) at time 
tW st hmin)i 
warning(msg); 
if haveoutfun 
feval Coutfun,[] [] done"); 
end 
if printstats % print cost statistics 
fprintf ( Mg successful stepsWn' , nsteps) ; 
fprintf Ур failed attempts Ni , nfailed) ; 
fprinf( %g function evaluations '  nfevals) ; 
{printf С %g partial derivatives Nn' , npds) ; 
fprintf(' %g LU decompositions\n’ , ndecomps? s 
fprint C %g solutions of linear systemsNn' , nsolves); 
end 
if nargout > 0 
tovt = tout(1:nout); 
yout = yout(1;:nout,;); 


if haveeventfun 
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03 := teout; 
o4 = yeouts 
o5 = ieout; 


o6 = [nsteps; nfailed; nfevals; npds; ndecomps; nsolves]s 


оз = [nsteps; nfailed; nfevals; npds; ndecomps; nsolves]; 
end 
end 
return; 


end 


if nofailed 
nofailed = false; 
absh = max (hmin, absh x тах(0.1, 0. 8 * Grtol/err) ^ pow: 
else 
absh = max(hmin, 0.5 * absh); 
end 
h = tdir ж absh; 


done =' false; 


else % Successful step 
break; 
end 
end 


nsteps = nsteps + l; % stats 


if haveeventfun 
[te ye ies walt sstop] = = 
odezero(' ntrp45’ vodefile valt t ry tnew ynew «t0, varargin +h Di 
nte = length(te) ғ 
if nte > 0 
if nargout > 2 
teout = [teout; te]: 
yeout = [yeout; ye.']: 
ieout = [iecut; ie]: 
end 
if stop % stop on a terminal event 
tnew = те(пќе); 
ynew = уеб: nte); 
done = trues 
end 
end 


end 
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if nargout 2» 0 


oldnout -= nout; 


if outflag == 3 26 computed points, with refinement 

nout = nout + refine; 

if nout > length (tour) 
tout = [tout; zeros(chunk.1),; 24 requires chunk 2» = refine 
yout = [yout; zeros(chunk neq]: 

end 

i = oldnout--1;nout —1; 

tout (D. = t + (mew—D * S; 

= nup45CGout() cy [] D] h D. 5s 


tnew; 


yout, 


tout (rout) 


yout(nout,:) = ynew. p 


elseif ow flag = = 2 М computed points, no refinement 


nout == пош + 1; 
if nou: > length(tout) 
tout = (tout; zeros(chunk,1)]; 
your = [yout; zeros¢chunk ,neq)J; 
end 


tout(nout) = tnew; 


уош пош, :) = ynew.‘; 
elseif ошар = = 1 % output only at tspan points 


while next <= ntspan 
if tdir * (пе — tspan(next)) < 0 
if haveeventfun & done 
nout = nout + 1; 


toutCnout) = thew; 


yout(nout, 
end 
breaks 
elseif tnew == tspan(next) 
пош = дош + 1; 
tout(nout) = tnew; 
ycut(nout,;) = ynew.'; 


next = next + 1; 


break; 
end 
пош = nout + l; % tout and yout are already allocated 


tout/nout) = tspan(next); 
yout(nout ,;) = ntrp45(tspan(next) stay [] [bh D. i 
next = next + 1; 

end 


end 


if haveoutfun 
i = oldnout+1 snout; 
if ~isempty(i) 8. (feval ошип ,tout (i) ,yout(i outputs). = = 1) 
tout = rout(1:nout); 
yout = yout (1 :nout,;); 
if haveeventfun 
c3 = teouty 
cd = yeouts 
05 = ieout; 
06 = [nsteps; nfailed; nfevals; npds; ndecomps; nsolves_; 
else 
03 = [nsteps; nfailed; nfevals; npds; ndecomps; nsolves_; 
end 
returns 
end 
end 
elseif haveoutfun 
if outflag == % computed points, with refinement 
tinterp = t + (tnew—t) * S; 
yinterp = ntrpdSCtnterp tyo] C] hD: 


if feval(outfun, [tinterpi mew], [yinterp (outputs, +), ynew (outputs) T> 


return; 
end 
elseif ошар == 2 
if fevelCoutfun,tnew, ynew(outputs)) = = 1 
return; 
end 
elseif ourflag = = % output only at tspan points 


ninterp — 0; 
while next <= ntspan 
if tdir * (пем — tspan(next)) < 0 
if haveeventfun & done 
ninterp = ninterp + 1; 
tinterp(ninterp,1) = tnew; 
yinterp(; »ninterp) = ynews 
end 
break; 
elseif tnew == tspan(next) 
ninterp = ninterp + 1; 
tinterp(ninterp.1) = mew; 
yinterp(;,ninterp) = ynew; 
next = next + l; 
break; 
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end 
mnterp = ninterp > 1; 
tinterp(ninterp,1) = tspan(next2); 
yinterp(; inter) = ntrp45(tspan (next) tiyo oslo oh D: 
next = next + 1; 

end 

if ninterp > 0 
if feval(ourfun. tinterp(1 :ninterp) syinterpCoutputs, 1 :ninterp)) 

тебип, 

end 

end 

end 


end 


5⁄4 If there were no failures compute а new h. 
if nofailed 
¥ Note that absh may shrink by 0. 8, and that err may be 0, 
temp = 1. 25 ж (err/rtol) ^ pow; 
if temp > 0.2 
absh = absh / temps 
else 
absh = 3.0 * absh; 
end 


end 


% Advance the integration one step- 
(= mew; 
у = ynews 


if normcontrol 


normy = normynew; 
end 
oD = 16.795 1⁄4 Already evaluated odefile(tnew ,ynew) 


end 


if haveoutfun 


feval(outfuny[] L5; done i 
end 


if printstats % print cost statistics 
fprintf а successful steps Ww! , nsteps) ; 
fprintf %g failed attempts W' » nfailed) + 
fprintf C %g function evaluations\n'» nfevals); 
fprintf  % partial derivatives\n' , npds); 
fprintf Юр LU decompositions\n’ , ndecomps) s 
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fprintf C йв solutions of lincar systems Wn , nsolves); 
end 


if nargout > 0 
tout = tout(l;nout); 
yout = ycut(1:nout.:)s 
if haveeventfun 
o3 = teouts 
ol = yeout; 
95 = ieout; 
об = [nsteps; nfailed; nfevalss npds; ndecomps; nsolves з 
else 
03 = [usteps: nfaileds nfevals; npds: ndecomps; nsolves]; 
end 
end 
64. function [tout yout .03,04,05,06 ] = odel5stodefile „тарап , yO options .varargin) 
函数 ODE15S 为 解决 刚性 常 微分 方程 的 初 值 问题 的 通用 程序 。 
[HF] 
[T.Y] = ODE15SCF',TSPAN,Y0) 
输入 参数 : 
TSPAN 为 积分 计算 区 间 矢 量 , 如 TSPAN = СТО TFINAL ]: 
YO 为 常 微分 组 的 初始 值 矢量 ; 
FARER E HEL THA TEAR. 
输出 参数 : 
T 积分 时 间 序 列 ， 
Y 为 在 积分 时 间 序列 的 常 微分 组 的 解答 阵 。 
使 用 示例 ， 
D 先 用 M 文件 定义 一 个 常 微分 方程 组 的 调用 函数 stiffitt,x)， 
function xdot— stiffl(t 305 
xdot(1)—x 1) + (—1+x(2)) +. 99 * xC2 s 
xdot(2) —100 x (x1) - (2) —х(1) * x22: 


xdot— xdor' ; 


将 此 函数 存 为 M 文件 。 
2) SEAT 28 a RO AK ode lis. HHA RAR RE BR: 
>ф=0; 
>= ?0, 
>x0=[0 .25] 
c>[t.x] =odel 5s Cstiff1’, [t0 tf],x0") 
leta) 


Ж ЭЙР ЕЕ FE. 2 Тһе MATLAB ODE Suite”, L. F. Shampine and М. W. Reichelt, SIAM 
Journal on Scientific Computing, 18-1, 1997. 


【程序 】 


true = logical(1); 
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false = ~~true. 


nsteps = 0; J stats 
nfailed = 0; М stats 
nfevals = 0; У stats 
У stars 
% stats 
И stats 


if nargin == 9 

error (' Not enough input arguments. See ODE15S. 2; 
elseif ~isstr(odefile) & ^isa Codefile, ‘inline’ ) 

error( First argument must be a single—-quoted string. See ODEI5S. 9; 
end 


if margin 


l 

tspan = []; yO = []; options = Г 
2 

у0 = [7]; options = []; 


elseif nargin == 3 


elseif nargin = 


options = []; 
elseif ~isempty (options) $. —isa (options , struct) 
if Clength(tspan) = = 1) & (length(y0) = = 1) & Gmin(size(opuons)) == 15 
tspan = [tspan; y0]; 
yO = options; 
options = [J; 
varargin == {}5 


"Vis", tspan ,yO, ** ) instead. ' ,odefile) ; 


msg == sprintf C Use odel5s( 
warning([‘Obsolete syntax, ° msg]? s 
else 


error (‘Correct syntax is odel5s("odefile",tspan  yO options). 2 : 


end 
end 
if isstr(odefile) & (exist (odefile) = = 4) % a SIMULINK model 


warning (['Future versions of this M — file will not support ‘+ 
'SIMULINK models. Use the SIM command directly. ; 


options —simset (‘Solver’ ,'odelós' , + 
'InitialState' , уб, 
‘RelTol’ ,odeget options," RelTol' ++ 
'AbsTol' ,odeget (options, ‘AbsTol’) ,+** 
‘Refine’ ,odeget (options ,’ Refine’) ,**- 
' MaxStep' ,odeget (options ."MaxStep’).-*- 
'InitialStep! ,odeget (options, InitialStep!) , =- 
"MaxOrder’ ,odeget (options ,' MaxOrder )) ; 
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У The cede before and after the call to sim copes the ToWorkspace 
% variables to the caller workspace. 

J, Note: we must use unique variables names at this point to be 

и disunct from ToWorkspace variable names. 

odefile _ cp2wksp = odefile; 

[tout _ep2wksp „yout cpZwksp,oà cp2wksp] ^ ° 


sim (odefile span ,options ,varargint ; >) 


% Copy ToWorkspace variables to the caller workspace. 
' 


names cp2wksp = find system (odefile  cpZwksp,'LookUnderMasks,' on 
' Block Type , ' ToWorkspace^ + 


for 1_cp2wksp = l;length(names | ep2wksp) 


varname _ cp2wksp = get _ param (names _ cp2wksp (i _ cp2wksp 
' VariableName') ; 
assignin caller, varname _ cp2wksp, eval(varname _ ep2wksp)) + 
end 
% Now safe to use tout, yout, and o3 


tout = tour, cp2wksp; yout = yout  ep?whsp: 03 = o3 cpiwhsp; 


return: 


end 


34 Get default tspan and yO from odefile if none are specified. 
if isempty span? | isempry (y0) 
if (margcut (odefile) < 3) & Gargout(odefile) ~= —1) 
msg = sprint (Use odel5s(”%s",tspan,y0, +) instead.  .odefile) : 


error ( No default parameters in ' upper(odefile) '. ' msg: 
end 


= fevalodefile [], 5, init ,varargint iD: 


[def tspan,def, y0,def option 
if isempty рап) 
tspan з= def _ tspan; 


end 

if isempiy (yO) 
yO = def _ y0; 

end 


if isempty (options) 

options = def options: 
else 

options = odeset(def _ options ,options) + 
end 


end 


У Test that tspan is internally consistent. 


tspan = tspan(:)s 
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ntspan = length(tspan); 
if ntspan = = 
10 = 0; 
next = l; 
else 
40 = tspan(}); 
next = 2; 
end 
tfinal = tspan(ntspan); 
if t0 = = tfinal 
error (The last entry in tspan must be different from the first entry. i 
end 
tdir = sign(tfinal — 10); 
if any(tdir + (tspan€2:ntspan) —tspan(1:ntspan—1)) <= 0) 


error The entries in tspan must strictly increase or decrease. ^) : 


end 
t= 105 
y = y0(:2i 


neq = length(y); 


% Get options, and set defaults. 
rtol = odeget(cptions,'RelTol’ .le—3)5 
if Clength(rtol) ~= 1) | (tol <= 0) 
error(’RelTol must be a positive scalar.) 
end 
if rtol < 100 * eps 
rtol = 100 * eps; 
warning (['RelTol has been increased to ' num2str(rtol) '.' s 


end 


atol = odeger(options,/AbsTol” ,le 一 6); 
if any(atol <= 0 
error(’ AbsTc) must be positive.) ; 


end 


normcontrol = stremp(odeget (options, NormControl" ,' off) ,'on' ) ; 
if normeontrol 
if length(atol) ~= 1 
error (Solving with NormControl "on" requires a scalar Abs Tol. '); 
end 
попту = norm(y); 
else 
if Cength(atol) ~= 1) & (length (ato). ~= neq) 


error(sprintf ([" Solving Мз requires a scalar AbsTol, ° += 


‘or a vector AbsTol of length 24d" ].upper (odefile? ,neq)); 


end 
atol = atoll; ); 
end 


threshold = atol / rrol; 


% By default, hmax is 1/10 of the interval. 


hmax = min(abs(tfinal-t), abs(odeget (options, ' MaxSrep' ,0. 1 (tfinal-t)))); 


if hmax <== 0 
error Option "MaxStep" must be greater than zero.) ; 
end 
htry = abst odeget (options, InitialStep/ )2 ; 
if htry <= 9 
error Option "InitialStep" must be greater than zero.) ; 


end 


haveeventfun = stremp(odeget (options, Events! ,"off'),"on")s 
if haveeventfun 


уак = feval(odefile t.y, ‘events’ »varargin{ +} Js 


teout — `]; 

yeout = [J 

кош = []; 
end 


if nargout >> 0 

outfun == odeget (options ,’OurputFen’ ) ; 
clse 

outfun = odeget(options ," OutputFcn' ,odeplot 2; 
end 
if isempty (outfun) 

haveoutfun = false; 
else 

haveoutfun = true: 

outputs == odeget (options ,' OutputSel' ,1:neq) ; 
end 


refine = odeget(options,'Refine’ ,1); 


printstats = stremp(odeget (options, Stats” ,off 2, on') ; 
Janalytic = stremp(odeget Coptions,' Jacobian! , off") s'on!) ; 
Jeonstant = stremp(odeget (options, Jconstant ""off'),’on")s 
Vectorized = stremp(odeget (options,"Vectorized | " ,'off s'on); 
Jpattern = stremp(odeget (options, Јрацега!, оН )，on')， 


if Jpartern 
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Js = feval(odefile, [J,[],'jpattern’ ,varargin([: 32 
else 
Js=[]s 


end 


mass = stremp(odeget (options, ' Mass! off) .on' 
if mass 
Mt = feval(odefile ,t,[]，mass' ,varargin! :}); 
Mconstant — strcmp (odeget Coptions ,’MassConstant’ ,rofD s'on’); 
else 
Mt = sparse((1 neq) . (1:neq)’.1.neq.neq)1% sparse Identity matrix 
Mconstant=t-ue; 
end 
if Mconstant 
Minew = Mt; 


end 


maxk ~ odeget options, MaxOrder' ,5); 
bdf = strcmp (оберег (options, BDF" ,'off'? ,on') ; 


% Set the output flag. 
if ntspan > 2 
outflag = 1; % output only at tspan points 


elseif refine <= 1 


ошай = 2: % computed points, no refinement 
else 
outflag = 3; У computed points, with refinement 
S = Girefine— 1Y / refines 
end 


% Allocate memory if we're generating output. 
if nargout > 0 
if ntspan > 2 % output only at tspan points 
tout = zeros(ntspan,1)+ 
yout = zeros (ntspan neq) ғ 
else % alloc in chunks 
chunk = max(ceil(128 / neq) ,refine); 
tout = zeros(chunk,1); 
yout = zeros (chunk neq); 
end 
пош = 1; 


Tont(nont) = t; 


yout (nout 


end 
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% Initialize method parameters. 
G = (1; 3/2: 11/6; 25/12; 137/607; 
ìf bdf 
alpha = 10; 0; 0: 0: 0]; 
else 
alpha 一 “一 37/200; —1/9; —0.0823, —0. 0415; 05; 
end 
invGa = 1./ (С. * (1=alpha)); 
erconst = alpha. * G + (01. / (2:60); 
dU = [-1, —2, —3, -4 —5s % dif U is its own inverse! 
© 1 3, 6 105 
0, 0, —1, —4 —105 
9, 9 0 Lh 5 
© 0 0, 0, -I] 
maxK = 1 maxk; 
[kJ kI] = meshgrid(maxK ,maxK) ; 
difU = difU(maxK ,maxKO ; 


maxit = 4; 


Y Maintair. backward compatibility with ODE files that don't accept flags. 


if isempty(varargin) 


args = {}; 
else М, There are extra arguments, so 
args = [4[2) varargin]; % stick an empty flag on the front 
end % before sending them to odefile. 


10 = feval(odefile try sargs{:})+ 


6 stats 


x 


nfevals = nfevals + 15 
[m,n] = size(fO); 
inl 
error [upper Codefile) ' must return a column vector. ]) 
elseif m — = neq 
msg = sprintf Can initial condition vector of length Jd. ' m3; 
error (['Solving ' upper(odefile) ' requires ' msg); 


end 


if Janalytic 
didy = fevalCodefile,t.y .’jacobian’ ,varargin{ iD: 
else 
jthresh == atol + zeros(neq+1); 
Сану facsg,nF] = "~ 
numjac Codefile ,: y £O jthresh ,[ 1, vectorized Ја, [largsi +): 


nfevals == nfevals + nF; % stats 
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end 
араз = npds + l; M stats 


JMcurrent = true; 


hmin = 16 x eps x abs(O ; 

if isempty Chtry) 
У; Compute an initial step size h using у' (1). 
absh 一 min(hmax, abs(tspan(next)—t)); 
if normeontrol 


wt = max(normy threshold); 


if mass 
2.0 = М0; 
ndecomps = ndecomps + 1; % stars 
FO = U\(L NO 
nsolves == nsolves + 1; М stats 
rh = (norm(F0) / wt) / (0.8 * sqrt (rtol)) +: 
else 
rh = (norm(f0) / wt) / (0.8 х ван (нор): 
end 
else 


wt = max(abs(y) threshold) ; 


if mass 
ELU lu(MO; 
ndecumps = ndecomps + 1; % stats 
Fo = UN (L NO; 
nsolves = nsolves + 1; % stats 


th = norm(FO . / wtsinf) / (0,8 * вагт); 
else 
th = norm(f0 . / wtsinf} / (0.8 a sqrt(rtol)); 
end 
end 
if absh «rh 25 1 
absh = 1 / rh; 
end 


absh = max(absh, hmin); 


% The error of ВРЕТ is 0.5 * h ° 2 * y' (0), so we can determine the optimal h. 
h = tdir * absh; 

tdel = (t + :dir * min (sqrt (eps) * max (abs(t) ,abs(t+-h)),ahsh)) 一 ts 

fl = fewal(odefile,t+tdel,y,args{:})+ 

nfevals = nfevals + 15 % stats 

dfdt = (f1—:0) . / tdel; 

absh = тіп (тах, abs(tspan (nexi) — 55; 


if normcontroi 


613 


th = 1.25 * sqrt(0.5 * (norm(U N (L N (dfdt + dídy + Fü))) / wt) / :toD 


rh — 1.25 * sqrt(0.5 * (normtdidt | didy *{0) / we) ¿ rol); 


th = 1.25 < sqrr(0, 5 ж norm((U \ (L Ñ (dídt + dfdy * FO) . 7 wtyinf) / rrol); 


th = 1.25 * sqrt(0.5 * normt(dfdt | ау + f0). / wt,inf) ¿ мору 


end 
ifabsh * th > 1 
absh = | / rh; 
end 
absh = max(absh, hmin); 
else 


absh = min¢hmax, max(hmin, htry D: 


end 


% Initialize. 


k=1 % start at order 1 with BDF1 
K=1; %K= lk 
klast = k; 


abshlast = absh; 


h = tdir x absh; 
dif = zeros(neqsmaxk +2); 


if mass 

dif, 1) = h ж F0; 
else 

dif(;,1) = h « fo; 
end 


hinvGak = h * invGa(k); 


nconhk = 0; % steps taken with current h and k 
[L.U; = lu(Mt—hinvGak x dídy); 
ndecomps = ndecomps + 1; У stats 


havrate = false; 


% Initialize the output function. 
И haveoutfun 
fevalCourfun , [t vfinal ] y outputs? init’); 


end 
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% THE MAIN LOOP 


done = false; 
while ~done 
% By default, hmin is a small number such that t + hmin is only slightly 
% different than t. lt might be 0 if t is 0. 
hmin = 16 * eps x abs(O ; 
absh = mir.(lunax, max(hmin, absh)); % couldn't limit absh until new hmin 


h = tdir x absh; 


% Stretch the step if within 10% of tfinal — t. 
if 1.1 * absh >= abs(tfinal—t) 

h = cfinal—t; 

absh = abs(h); 

done — true; 


end 
if (absh ~ = abshlast) | (k ~= klast) 
difRU = cumprod((kI — 1 — kJ « (absh/abshlast}) ./ kD * diU; 


dif(;,K) = dif(:.K) * difRU(K K); 


hinvGak = h * invGa(k); 


nconhk -- 0; 
[L.U] == lu(Mt—hinvGak. * dfdy); 
ndecomps = ndecomps + 1+ И stats 


havrate == false; 
end 


% LOOP FOR ADVANCING ONE STEP. 


nofailed = true; % no failed attempts 
while true 
gotynew = false; % is ynew evaluated yet? 


while ~gotynew 


°% Compute the constant terms in the equation for ynew- 


psi = ФСК) * (G(K) * invGa(k)); 


% Predict а solution at t--h. 
tnew = t+ hy 
pred = y + sum(difC; KO 22; 


ynew = pred; 


% The difference, difkp1, between pred and the final accepted 


% ynew is equal to the backward difference of ynew of order 


% k=l I 
difkpl == zeros(neq,1); 


И normcontrol 


normynew = norm(ynew); 


jalize to zero for the iteration to compute ynew. 


invwt = / max(max(norm(y) ,normynew? threshold) ; 


minrrm = 100 * eps * (normynew * invwt): 


else 


invwt = 1./ max(max(abs(y).abs(ynew)) threshold); 


minrrm = 100 * eps * norm(ynew . x invwt,inf)s 


end 


% Mtnew is required in the RHS function evaluation. 


if 一 Moonstant 


Minew = fevalCodefile,t.[ ], mass’ ,varargin 


end 


% Iterate with simplified Newton method. 
tooslow = false: 


for iter = 1:maxit 


del == U N (L \ (hinvGak x fevalCodefile, tnew synew sargs { + 


Mtnew ж (psitdifkp1))); 

if normcontrol 

newnrm == norm(del) * invwt; 
else 

newnrm = norm(del. * invwi,inf; 
end 
difkpl — difkpl — del; 
ynew = pred + difkp1; 


if newnrm <= minnrm 
gotynew — true; 
break; 


elseif iter 


if havrate 
errit = newnrm * rate / (1 —rate); 
if errit <= 0. 05 * rtol 


gotynew = true; 


break; 
end 
else 
rate = 0; 


И More stringent when using old rate- 
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elseif newnrm > 0. 9 ж oldnrm 
tooslow = true; 
break; 
else 
rate = max (0, 9 * rate, newnrm / oldnrm); 


havrate = true; 


errit = newnrm * rate / (1 — rate): 
if erit <= 0.5 * rtol 

gotynew = true; 

break; 
elseif iter == maxit 


tooslow = true; 
break; 
elseif 0. 5 ж rtol < errit # rate” (maxit-iter) 
tooslow = true; 
break; 
end 


end 


oldnrm = newnrm; 


end 34 end of Newton loop 
nfevals == nfevals + iter; Ж stats 
nsolves == nsolves + iter; У stats 
if tooslow 
nfailed = nfailed + 1; Ж stats 


И Speed up the iteration by forming J(t, y) or reducing h. 
if ~ JMeurrent 
if ~Jeonstant 
if Janalytic 


Фу = feval Codefile.t.y.'jacobian' ,varargin i: }); 


else 
{0 = feval(odefile,t,y args: :1): 
[dídy.fac.g.nF] = 


numjacCodefile ,т,у ,f0,jthresh .fac,vectorized .Js.gsargs{:})+ 
nfevals = nfevals — nF + 1; % stats 
end 
npds = npds + 1; % stats 
end 
JMcurrent = true; 
elseif absh <= hmin 
msg = sprintf (['Failure at t= Ме. Unable to meet integration ! =+ 
‘tolerances without reducing the step size below ' + 


"the smallest value allowed (34e) at ume t. V], s 


t hmin); 
warning (msg) ; 
if haveoutfun 
fevalCoutfun [7 1, done 2; 
end 
if printstats И print cost statistics 
fprintf( Ма successful steps\n’, nsteps) : 
fprintf  Yg failed attempts W' -. nfailed) ; 
fprintfC %g function evaluations Wn! , nfevals) ; 
fprintf C %g partial derivatives Nn! , npds); 
fprintf %g LU decompositions V , ndecomps) з 
fprintfC %g solutions of linear systems Nn' , nsolves) : 
end 
if nargout > 0 
tout = tout(1 snout); 
yout = yout(l;:nout,;); 
Í haveeventfun 
03 = teout; 
04 = yeout; 
05 = ieouti 
06 = [nsteps; nfailed: nfevals; npds; ndecomps; solves]; 
else 
o3 = [nsteps; nfailed; nfevals; праз; ndecomps; nsolves ]; 
end 
end 
return; 
else 
abshlast = absh; 
absh = max(0.3 * absh, hmin); 
h = tdir * absh; 


done = false; 


difRU = cumprod ((kI—1—k] + (absh/abshlast)) ./ kI) * difU; 
dif(:,K) = dif(: ,K) * difRU(K,K); 


hinvGak = h ж invGa(k)s 
nconhk = 0; 
end 
[L.U] = lu(Mt—hinvGak * dídy), 
ndecomps = ndecomps + 1; 36 stats 
havrate = false; 
end 


end 1⁄4 end of while loop for getting ynew 
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% difkp1 1s now the backward difference of ynew of order k+ 1, 
if normcontrol 


err = (norm(difkpl) * invwt) * erconst(k); 


else 
err = norm(difkpl. * invwt.inf) * erconst(k): 

end 

if err > rtol % Failed step 
nfailed = nfailed + 1; М stats 


if absh <= hmin 


msg = sprintf (['Failure at t= %e. Unable to meet integration ' 


‘tolerances without reducing the step size below 
‘the smallest value allowed (Ye) at time 
tn t hmia); 
warning(msg); 
if haveoutfun 
еа ошоп»), D); done) ; 
end 
if printstats % print cost statistics 
fprintf ( %g successful steps n , nsteps? + 
{printi а failed attempts sn! , nfailed) + 
ріпи %g function evaluations Ww' , nfevals) : 
fprintf  %%g partial derivatives W' , npds); 
fprintf 6g LU decompositions\n’, ndecomps? ; 
fprintf 968 solutions of linear systems ui! , nsolves) « 
end 
if nargout > 0 
tout = tout(1:nouO ; 
yout = yout(1:nout, :); 


if haveeventfun 


03 = teouts 

о4 = yeouts 

o5 = ieout; 

06 = [nstepss nfailed; nfevals; праз; ndecomps; nsolves]; 
else 


03 = [nstepss nfailed; nfevalsy npds; ndecomps; nsolves J; 
end 
end 
return; 
end 


abshlast = absh; 
if nofailed 


nofailed = false; 
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hop: = absh * max(0.1, 0. 833 * (rtolZerr) ` (1/(К—1))): % 11.2 
i k > 1 
if normcontro] 
errkm] = (norm(dif(,,k) + difkp1) * invwt) * erconst(k—1); 
сїзє 
errkm1 = norm((dif(:,k) + difkpl) . + invwtsinf) * erconst(k—1); 
end 
ham] = absh + max(0. 1, 0. 769 x (rtol/errkm1) ^ (1/k)); % 1/1. 8 
if hkm1 > hopt 


hopt = min(absh ,hkm1) ; ¥ don't allow step size increase 
k—k—l 
K = tik: 

end 


end 
abst = max(hmin, hopO : 
else 
abs = max(hmin, 0.5 * absh); 
end 
h = tdir * absh; 
if absh < abshlast 
done — false; 


end 


difRU = cumprod((kI—1—kJ * (absh/abshlast)) . / КЇ) x difU; 
difC; K) = dif(.,K) * difRUCK.KO; 


hinvGak = h ж invGa(k); 

nconhk = 0; 

[L.U] = la(Mt - hinvGak x didy); 

ndecomps 一 ndecomps + 1; М stats 


havrate = false; 


else % Successful step 
break; 
end 
end 
nsteps = nsteps + 1; X stats 
dif(,,.k+2) = difkpl~dif(..k+1)s 
dif(;,k+1) = difkpl; 
forj =k; ~1;1 


а.) = dif Gj) 十 df( 十 1D; 


end 
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tstep 一 tnew; 
умер = ynews 
if haveeventfun 
[tesyesie,valt stop] 一 … 
odezero!' ntrp15s' ,odefile,valt,t,y ,tnew.ynew t0, varargin sh dif yk); 
nte = length(te); 
if nte > С 
if nargout > 2 


teout = [teout; te]; 


yeout = [yeouts yer 
ieout = [ieout; ie]; 
end 
if stop % stop on a terminal event 
mew = fe(nte); 
ynew = ye(:,nte); 
done — true; 
end 


end 


end 


if nargout > 0 


oldnout =: nout; 
% computed points, no refinement 


if outflag 
nout = nout + 1; 
И nout > length (tout) 


tout =+ [touts zerosCchunk,1) 
yout = [youty zeros (chunk neq) ]; 
end 
tout {nout) = thew; 


yout(nout,;) = ynew- 
3 % computed points, with refinement 


elseif outilag = 
nout = nout + refines 


if пош! > length (tout) 
requires chunk >= refine 


tout = [tout; zerosCchunk 1) ] 
yout = [yout; zeros (chunk , neq) J; 

end 

i = oldnout - 1:nout — 1; 

tour(i) = t + (new—0 * S; 

yout(i.:) = ntrpi5s(tout (D ,[]. [] .tstep.ystep sh dif lO. "5 


tout (nout) = tnew; 


yout(nout,:) = ynew. 
1 % output only at tspan points 


elseif outflag 


while next <= ntspan 


if tdir * (tnew—tspan(next)) < 0 
if haveeventfun & done 
nout = nout + 1; 


lout(nout) = mew; 


yout(nout,:) = ynew.'; 
end 
break; 

elsef tnew == tspan(next) 


пэш = пош + l; 
tout(nout) = tnew; 
yout(nouts;) = ynew.'; 
next = next + 1; 
break; 

end 

nout = nout + 1; 

хош (nout) = tspan (next); 


yout(nout,;) = 


ntrp15s¢tspan(next).[].(],tstep,ystep +h dif, k). ' ; 


next = next + 1; 
end 


end 


if haveoutfun 


i = oldnout+ 1:nout; 


if —isempty (i) & Clewal(outfun, tout(i) „yout i outputs). ') = 


tout = tout(1:nout)+ 
yout = yout(l;nout,;); 
if haveeventfun 

03 = teout; 

04 = yeout; 

o5 


ieout; 


И tout and yout are already a Joeated 


D 


o6 = [nsteps; nfailed; nfevals; npds; ndecomps; nsolves1; 


else 


03 = [nsteps; nfailed; nfevals; npds; ndecomps; nsolves_; 


end 
return; 


end 


end 


elseif haveoutfun 


if outflag 2 


if fevalCoutfun ,tnew ,ynew (outputs)) = 


return; 


end 
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elseif опар == Y computed points. with refinement 
tinterp = t + (mew 一 D x $i 


yinterp = ntrpl5s(tinterp,[],[] «tstepsystep.h dif, k3: 


if feval Coutfun.[tinterp; tnew ],[yinterp(outputs, 1), ynewtoutputs)]) = 
return; 
end 
elseif outflag 一 一 1 Y output only at tspan points 
ninterp = 0; 
while next <= ntspan 
if tdir + (tnew—tspan(next)) < 0 
if haveeventfun & done 
ainterp = ninterp + 1; 
sinterp(ninterp, 1) = tnew; 
yinterp(; mnterp) = ynew: 
end 
break; 


elseif tnew tspan (next) 
nipterp = ninterp + 1; 
tinterp(ninterp,1) = tnew; 
Virterp( 1 ,ninterp) = ynew; 
next = next + 1; 
break; 
end 
ninte-p = ninterp + 1; 
tinterp(ninterp,1) = tspan(next}; 
yintesp(: sninterp) = 
nirp]5s(tspan (next) .[],[],tstep.ystep bh dif Kk); 
next = next + 1; 
end 
if ninterp > 0 
if fevalCoutfun ,tinterp(1 ;ninterp) ,yinterpCoutputs,1:ninterp)) == 1 
return; 
end 
end 
end 
end 


Маз = k; 
abshlast = absh; 
nconhk = min(nconhk+1,maxk+2); 
if nconhk >= k + 2 
temp = 1. 2 ж Cerr/rtoD ^ (1/(k+12); 
if temp > 0.1 
hopt = absh / temp; 
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else 
hopt == 10 * absh; 
end 
kopt = k; 
ifk > 1 
1f normeontrol 
errkmi == (norm(difé;,k)) * invwt) x erconst(k —1): 
else 
errkml = norm(dif(:,k) . + invwt,inf) * erconst(k 1); 
end 
temp = 1.3 * Cerrkml/rtoD^ (1/k); 
if temo > 0.1 
hkml = absh / temp; 
else 
hkml = 10 * absh: 
end 
if hkm? > hopt 
hopt = hkm]; 
kopt = k 1; 
end 
end 
if k < maxk 
if normeontrol 
errkpl = (norm(dif(;,k--2)) x invwt) ж erconst(k +1); 
else 
errkpl 一 norm(dif(.,4+2) - * invwt,inf) + erconst(k~1); 
end 
temp — 1. 4# (errkp1/rtol) ^ (1/(k +2)); 
if temp > 0.1 
hkpl = absh / temp; 
else 
hkpl = 10 * absh; 
end 
if hkpl > hopt 
hopt = hkpl; 


kop =k + 15 
end 
end 
if hopt > absh 
absh = hopt; 
if k ~ 一 kopt 
k = kopt; 
K = lik; 


end 
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end 


end 


У Advance the integration one step. 
t = mew; 
y = ynew; 
JMcurrent := Jconstant & Mconstants 
if — Mconstant 

Mt = Mtnews 


end 


end 


if haveoutfun 
fevalCoutfun ,L], L1, done >; 


end 


if printstats 
fprintf ( Ме successful steps Ww » nsteps? ; 
fprintf ( %g failed attempts Wn , nfailed) ; 


{printf C %g function evaluations Ww , nfevals) ; 


{рїш С g partial derivatives , npds) i 


У print cost statistics 


fprint£( %g LU decompositions Ww! , ndecomps) ; 


fprintf(’ %g solutions of linear systems Nn' , nsolves); 


end 


if nargout > 0 


tout = tóu:(1,a0u0); 
yout = yout(1;nout,;); 
if haveeventfun 

03 = teouts 

o4 = yeouts 

05 

06 


ieout; 


else 


[nstepss nfailed; nfevals; npds; ndecomps; nsolves]; 


o3 = [nsteps, nfailed; nfevals; npds; ndecomps; nsolves]; 


end 


end 


65. function а = appcoef(c,],arg3,arg4,arg5) 
函数 APPCOEF ATHE {Н 8 BERR. 


【例子 】 


CO HR А = APPCOEF(C,L,’wname! ND 
用 于 计算 一 维 信号 的 小 波 分 解 水 平 N 的 下 过 系数 


其 中 参数 : 
structure [C,L] (参见 WAVEDEC); 
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'wname' 为 一 字符 捉 变 量 ,用 以 表示 所 用 小 波 名 ， 
KFN 必须 为 一 整数 0 <= N < 一 (L) 的 长 度 一 2. 
(2) HE А = APPCOEF(G.L.’wname') 
用 于 计算 一 维 信号 的 小 波 分 解 水 平 N— (L) KE T PETROLIO S RE X IRI RE 
(3) Ё A = APPCOEF(C:L,Lo_R,Hi_R)? or 
А = APPCOEF(C,L,Lo R.Hi R;ND, 
其 中 参数 Lo _R 是 重 构 低 通 滤波 器 及 Hi к 是 重 构 低 通 滤波 器 .其 他 参数 意义 同 前 。 
参见 DETCOEF, WAVEDEC. 


【程序 】 


% Check arguments- 


if errargn('appeoef’ ,nargin,[3: 5 ]snargout; [0:1]2 » error" +"), end 
rmax = length(D; 
nmax = rmax— 2; 
if isstr(arg3) 
[LoF R.HiF R] = wfilters(arg3.'r 


if nargin == 4, п = argás else, п = nmax; end 
else 

LoF R = erg: HIF _ R = arg4; 

if nargin == 5, n = arg5; else, n = nmax; end 
end 


if (n < 0) | (n > nmax) | (n ~= fix(n)) 
errargt Cappcoef' ,'invalid level value’ ,'msg'); error C * 2, 


end 


% Initialization. 
a = (1:00), 


% Iterated reconstruction, 

imax = rmaxt1; 

for p = птах: —1:п+1 
d = detcoef(cil p? ; % extract detail 
a = idwt(a,d,LoF R,HiF _R.lGmax—p)); 


end 
66. function F = coifwavf (wname) 
函数 COIFWAVE 用 于 计算 Coiflets ЛУКИ. 
【例子 】 
F = COIFWAVE (W) 
计算 尺度 滤波 器 。(scaling filter) 
其 中 字符 审 参 数 ， 
W = 'coifN'; 


N 的 可 能 数 全 为 ,IN = 1, 2, 3, 4 or 5, 
参见 WAVEINFO. 
【程序 


% Check arguments. 
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if errargn (‘corfwavf’ ,narglny LI],nargout,[0:1])，errorC #"); end 


lw 一 length(wname); ab = abs(wname) ; 
ii = Iwi, 


while (47<abGi—1)) & (GbG —1)58) ,i = ii— 


num = strZnum(wname(ii 1w)) ; 


if num== =] 

F = [e 
—0.05142972847100 0. 23892972847100 0. 60285945694200 0. 
— 0. 05142972847100  —0.01107027152900 


214054305800 


0. 01158759673900 —0:02932013798000 —0. 04763959031009 0. 27302104653500 
0. 57468239385700 0. 29486719369600 – 0. 05408560709200 — 0. 04202648046100 
0. 01674441916300 0. 00396788361300 —0. 00128920335600 —0. 00050950539900 


ч 


elseif num 一 一 

F—[- 
— 0 00268211867100 0.0055081267С900 0.01658356047900 ~ 0. 04650776447900 --- 
—0. 04322076356000 0. 28650333527400 0.56128525687000 0. 30298357177300 
— 0. 05077014075500 —0. 05819625076200 0. 02443409432100 0. 01122924096200 -- 
—0. 00636950101100 —0. 00182045891600 0. 00079020510100 0. 00032966517400 «e 


— 0. 00005019277500 —0. 00002446573400 
3 


elseif num= —4 

F-[- 
0. 00063096104600 — 0. 00115222485200 —0. 00519452402600 0. 01136245924400 
0. 01886723537800 —0. 05746423442900 —0. 03965264851700 0. 29366739089500 
0. 55312645256200 0. 30715732619800 —0. 04711273886500 —0. 06803812705100 -= 
0. 02781364015300 0. 01773583743800 —0. 01075631851700 —0. 00400101283600 
0. 00265266594600 0. 00089559452900 —0. 00041650057100 一 0, 00018382976900 ^" 
0. 00004408035400 0. 00002208285709 —0. 00000230494200 --0. 00000126217500 -.. 

ds 


elseif num 
F= [e 
— 0. 00014996380000 0. 00025356120000 0. 00154024570000 --0. 00294111080000 
— 0. 00716378190000 0. 01655206640000 0. 01991780430000 0. 06499726280000 
一 0. 03680007360000 0. 29809232350000 0. 5475054294000) 0. 30970684900000 


— 0. 04386605080000 --0.07465223890000 
— 0. 01397368790000 -0. 00648009000000 
—0. 00117582220000 — 0. 00045122700000 
—0, 00002923210000 — 0. 00001507200000 

9. 00000011840000 — 0. 00000006730000 


0. 02919587950000 
0. 00478300140000 
0. 00021372980000 
0. 00000264080000 


J 
else 
errargt Ccoifwavi ‚Invalid coiflet ‚,'тпзӊ' 2: 
ето *'); 
end 


67. function w = dbaux(N,sumw? г 


BUR DBAUX 用 于 计算 Daubechies 小 波 滤波 器 


【例子 】 
W = DBAUX(N,SUMW) 


用 于 计算 尺度 为 N 的 Daubechies 尺度 滤波 器 ,scaling filter such that SUM(W) = SUMW. 


N 的 可 能 取信 为 ; N = 1, 2, 3, 0+ 
注意 : 当 N 太 大 时 可 能 会 引起 不 稳定 。 


W = DBAUX(N) 就 等 于 W = DBAUX(N,1). 
W = DBAUX(N,0) 也 等 于 W = DBAUX(N,1). 
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参见 DEWAVF, WFILTERS. 
【程序 】 


У Check arguments. 


if errargn (dbaux! nargin [1:2] nargout, 20:17), error( « 2; end 


if nargin < 2, sumw = 1; end 


if sumw == 0 , sumw = 1; end 


% Order n daub sealing filter computation 
% using "Lagrange" filters- 

lon = 2*N- N 

sup = [-N+1:N]; 

а = zeros(1.N); 

for k = iN 


nok = sup(sup ~= k); 


atk) = prod (0. 5— пок) /prod(k~-nok) + 


end 
P = dyadup(a,0); 


P = [wrev(P),1,P 5; М "Lagrange a trous" filter such that 


% P = conv(wrev(w),w) * 2 if w 


% denotes the order N daub scaling filter. 


rP = roots(P); 
[s,K] = sort (abs(rP)); tP = rP(K); 


[s,K] = sort (abs (rP-H1)); rL = ТРЕК (lon—2:2 «lon: 


[sK] = sort(abs(rL)); 1. = rLOO 


Q. 02317077790000 
0. 001720653470000 
0. 00009937730000 
0. 00000145930000 
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М rL gives partial root location of w. 
% w have N zeros located at 1. 
w = real(poly([rL (abs(rL) <1) ;—ones(N 2 
w = sumw * (w/sum(w)); 
68. function F = coifwavf(wname) 
(1) F == COIFWAVECW) 
计算 尺度 滤波 器 。(scaling filter) 
RR BBM W = 'eoifN 
N 的 可 能 数值 为 :N = 1, 2, 3, 4 or 5. 
参见 WAVEINFO. 
(2) function F = dbwavfCwname) 
函数 DBWAVF M FHI Daubechies / I REDE 88. 
【例子 】 
F = DBWAVE(W) 
计算 Daubechies 小 波 尺度 沥 波 器 。(scaling filter) 
RES Е 4 
W = 'dbN'. 
N 的 可 能 取 值 为 ， 
N= 1,2,3, 4 50. 
参见 DBAUX, WAVEINFO, WFILTERS. 
【程序 】 
% Check arguments. 
if errargn ('dbwavf" ,nargin,[1],nargout, [0:1]), errorC’ +’); end 


if lower(wname(1;2))=="ha! 


num = 1; 
else 
lw = length(wname); ab = abs(wname); 
i = lw+1; 
while (47<ab(ii—1)) & (abGi —1)«:58) „і = ii— 1: end 
num = str2num(wname(ii;lw)); 
end 
if num- =] 
F= [= 
0.50000000600000 0. 50000000000000 
ji 
elseif num = = 2 
Е= [= 
0.34150635094622 0. 59150635094587 0. 15849364905378 — 0. 09150635094587 
Ji 
elseif num 一 一 3 


F = [e 


0.23523360389270 0,57055845791731 0.32518250026371 —0. 09546720773426 
—0. 06045 610415535 0. 02490874986589 


J; 
elseif num— = 
F = [e 
0.16290171402562 0. 50547285754565 0. 44610006912319 0. 01978751311791 =- 
—0. 13225358368437 0. 02180815023739 0. 02325180053556 — 0. 00749349466513 
1+ 
elseif num 一 一 5 
F = [= 


0.11320949129173 0. 42697177135271 0. 51216347213016 0, 09788348067375 
— 0. 17132835769133 — 0. 02280056594203 0. 05485132932108 0. 00441340005433 
一 00889593505093 0. 00235871396920 


elseif num= 
下 = [ow 
0. 0788711600143 0. 34975190703757 0.5311318799412} 0. 22291566146595 + 
—0. 15999329944587 — 0. 09175903203003 0.06894404648720 0. 01946160435396 
— 0. 022331874165348 0. 00039162557603 0. 00337803118151 0. 00076176590258 


elseif num 


0. 05504971537285 0. 28039564181304 0.51557424581833 0. 33218624110556 
一 小 10175691123173 — 0. 15841730564054 0. 05042323250485 0.05700172257986 


— 0. 02689122629486 — 0.01171997078235 0. 00887489618962 0.00030375749776 ++ 


— 0. 00127395235906 0. 00025011342658 
1 


ds 


elseif num= 
F = [e 
0. 03847761105406 0. 22123362357924 0. 47774307521438 0. 41390826621156 
-0. 01119286766665 — 0. 2008293163911} 0. 00033409704828 0. 09103817342345 
— 0, 01228195052300 — 0. 03117510332533 0. 00988607964808 0. 00618442240954 
— 0. 00344383962813 — 0- 00027700227421 0. 00047761485533 — 0. 00008396863060 
2 


elseif num= 
F = [e 
0.02692517479416 0. 17241713192471 0. 42767453217028 0. 46477285717278 + 

0. 09418477475112 —0. 20737588089628 —0. 06847677451090 0. 10503417113714 + 
0. 02172643772990 —0. 04782363205882 0. 00017744640673 0. 01581208292614 


629 


630 


—0.00333981011324 —0. 00302748028715 0. 00130618361015 0. 00016290733601 + 
—0. 000178154879553 0. 00002782275679 
di 

elseif num— —10 
F= 

0. 01885857879640 0. 13306109139687 0. 37278752574266 0. 48681405536610 

0. 19881887088440 —0. 17666810089647 —0. 13855493935993 0. 09006372426666 

0. 06580149355070 —0. 05048328559801 — 0. 2082982404385 0. 02348490704811 +" 

0. 00255021848393 —0. 00758950116768 0. 000986662682344 0. 6151 40884329496 

— 0. 00048497391996 --0. 00008235450295 0. DB0006617718320 — 0. 70060937920789 

J; 


elseif (11< = num) & (пит< = 50) 


F = dbaux (num); 


else 
error( ж * # Invalid Daubechies wavelet number | * ж +°); 

end 

69. funciion [thr,sorh,keepapp.crit] = ddencmp(dorc,worwp.x) 

Ж DDENCMP AFHR ARRERA. 

【例子 】 

(1) (THR.SORH,KEEPAPP.CRIT_ = DDENCMP(IN1,IN2,X) 

返回 可 用 了 小 波 或 小 波 包 去 蝇 或 压缩 的 顶 置 值 - 

LES I 

INI 可 为 "den'( 表 示 去 噪 de noising) aH "emp! SUR HEH compression); 

IN2 P| ‘wv! (表示 小 波 ) 或 为 ‘wp' (表示 小 波 包 ); 

入 可 为 一 维 信 号 (矢量 ) 或 二 维 信 号 (矩阵 

输出 参数 ， 

THR AE (threshold), SORH 表示 软 (soft) QB (hard) У ER: 

KEEPAPP ftit Fi P BL E B XE KM (approximation coefficients); fH CRIT 只 用 于 小 波 包 。 

(D 对 于 小 波 { 只 需 三 个 输出 参数 ), 即 

[THR ,SORH,KEEPAPP] = DDENCMP(IN1 .‘wy' X) 

返回 可 用 于 小 波 去 品 ( 如 果 INT = беп) 或 压缩 (如 果 INI = “cmp') 的 预 置信 ,所 得 预 置 值 可 用 于 
WDENCMP 函数 

(3) 对 于 小 波 包 ( 需 四 个 输出 参数 ), 即 

LTHR.SORH,KEEPAPP.CRIT] = DDENCMP(IN1, wp' ,X) 

返回 可 用 于 小 波 去 噪 (如 果 INI = den) 或 压缩 (如 果 INI = 'emp') 8 BUR (Ë , Pr (BUR (Ñ p| PI T 
WDENCMP 函数 

参见 WDENCMP. WENTROPY, WPDENCMP. 

【程序 】 
% Check arguments, 
if lengrh(worwp) ~= 2 


errargt ('ddencmp’ ,'invalid argument value’ ,msg' 9; error ж 0 


end 


if worwp 一 


if errargn C ddencmp' snargin, [3], патдошк, 0:31), error =), end 


DN 


wp 


if errargn C ddenemp! ,nargin, [3] nargout [0:4 D, error * D. end 


elseif worwp 


else 

errargt C daencmp! "invalid argument value! „атов: error’ x!) 
end 
if length(dorz) ~~ = 3 

errargt ddenemp' ,'invalid argument value msg) error + ') 
end 
if (dore ~ = 'den') & (dore ~= 'emp') 

errargt  ddencmp' invalid argument value’ msg); error C *') 


end 


\ Set problem dimension. 

dim = 1; 

if min(size(x)) ~= 1, dim = 2; end 
5⁄4 Set keepapp default value. 

keepapp = ..; 


% Set sorh default value. 


sorh = 'h/; 
И dore == ‘den! 

if worwp === 'wv', sorh = 's', end 
end 


% Set threshold default value. 
n = prod(size(x)); 


% nominal threshold. 
if dore = = ‘den’ 
if worwp == 'wv' % wavelets case. 
thr = sqrt (2 * log(n)); 


else % wavelet packets 


thr = sart(2 * log(n * log(n)/log(2)) 94 


¥ rescaled threshold. 


if dim == 
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[е,1] = wavedec(x ,1,'dbl'); 
ç = c(|(1)+1:length(c)); 
else 
[eI] = wavedec2(x, 1, db1); 
c = cfprod (11, :22— 1ilength(c2 s 


end 


normaliz = median(abs(c)); 
% if normaliz=0 in compression, kill the lowest coefs. 
if dorc == ‘cmp! & normaliz = = 0 

normaliz == 0. 05 + max(abs(c)) : 


end 


if dorc == ‘den’ 
if worwp = == Swe! 
thr — thr * normaliz/0. 6745; 
else 
Crit == ‘sure’; 
end 
else 
thr = thr * normaliz; 
if worwp == ‘wp’, crit = ‘threshold’; end 
end 
70. function d = detcoef(c,l,n) 
函数 DETCOEF 用 于 计算 一 维 信号 的 细节 系数 (detail coefficients). 
【例子 】 
(1) D = DETCOEF(C.L.NJ 
从 小 波 分 解 结构 [C,L] 来 计算 水 平 N 的 信号 细节 系数 
at level N from the wavelet decomposition structure 
(参见 WAVEDEC). 
水 平 N 必须 是 一 个 整数 , 即 1 <= N <= ОКЕ 2. 
(2) D = DETCOEF(C,L) 
从 小 波 分 解 结构 [C,Lj 来 计算 水 平 n = (L) I KE 2 的 信号 细节 系数 。 
参见 APPCOEF, WAVEDEC. 
【程序 】 


% Check arguments. 


if errargn (C detcoef ,argin, [2:3],nargout [0:1 D, error ж ") send 
rmax = length! 1); 


nmax = rmax-—2; 


if nargin =2 . n = nmax; end 
if (n < 12 | (r > nmax) | (n ~= fix(n)) 
errarg (detcoef' ,’invalid level value’ msg); error +°); 


end 
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% Extract detail coefficients. 
k 一 rmax n; 
first = sum(1(1:k—1)) +13 
last = first-+1(k3—1; 
d = cCfirst :last) ; 
71. function [asd] = dwt(x.arg2,arg3) 
函数 DWT 用 于 单 水 平一 维 小 波 人 变换 。 
DWT 执行 单 水 平一 维 小 波 分 解 ,其 中 字符 占 参数 (arg2) 可 用 于 不 同 得 小 波 职 数 
(wname’ ,参见 WFILTERS) 或 者 指定 的 小 波 滤波 器 (Lo Dand Hi р). 
【例子 1 
(1) [CACD] = DWT(X,'wname') 
ТЖЖЖ# СА 和 细节 系数 矢量 CD: Жой ЕЙ BER 'wname' 用 于 表示 小 波 医 数 名 . 
(2) [CA,CDJ = DWT(X,Lo_D,Hi_D) 
用 给 定 的 小 波 滤波 器 计算 小 波 分 解 的 通 近 系数 矢量 CA 和 细节 系数 矢量 СО. 
输入 参数 Lo D 是 分 解 的 低 通 滤波 器 而 Hi D 是 分 解 的 高 通 滤波 器 ,Lo _D 和 Hi _D 必须 具有 同样 
长 度 。 
ШЖ lx 为 信号 (X) 的 长 度 , Н 为 滤波 器 的 长 度 , 则 有 ， 
length(CA) = length(CD) = FLOOR((x+lf—1)/2). 
对 于 不 同 得 信号 扩展 模式 (signal extension modes), 参见 DWTMODE. 
参见 DWTMODE, DWTPER, IDWT, WAVEDEC, WAVEINFO. 
【程序 了 


global DWT Ext Mode 


% Check arguments. 
if errargn( dwt' ,nargin [2:3] ;nargout [0:2 » error(* *"). end 
if nargin — — 2 


[LoF D.HiF, D] = wfiltezs(arg2, d); 


else 
LoF D = arg2; НЕ _D 一 arg34 
end 
if isempty(DWT _ Ext _ Mode) | DWT _ Ext _Mode= ='zpd' % apd is the default 


% Decomposition. 
а = dyaddown(conv(xsLoF | D: 
d = dyaddown(conv(x,HiF _D))s 


elseif DWT Ext Mode—-—'sym' 


74 Symmetrization. 
Ix = length (x); 
lf = length(LoF DO; 
if size(x,122— —1 
x = [xdf —1:D x xx: — Ldx—1E-1)]; 


else 
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x = [xtlf:—1el)s x 5 x(lx; —1:1x—1f11)J; 


end 


% Decomposition. 

la — fleor(Ox *1£—- 12/25; 

a = wkeep(dyaddown(cony(xsLoF _ 09) а): 
d = wkeep(dyaddown(conv(x,HiF _ D)),la); 


elseif DWT _ Ext _ Mode— ='spd' 


% Smooth padding. 
Ix — length GO; 
И = length(LoF DO; 
if size D= —1 

x — [zeros Cl db) x zeros CL, J; 
else 

x = [zeros(lf 125 x з zeros(I 12]; 
end 
for к= —1:1 

xk) = 2xx(k+1)-—x(k+2); 
end 
for k=I--Ix +1 :lx+2 * 1 

x(k) = 2*x(k—-D—x(k-2; 


end 


% Decomposition. 
la = floor (x-+If—1)/2); 

= wkeep(dyaddown(conv(x,LoF | D)) da) 
= wkeep(dyaddown(conv(x,HiF _ D)),la); 


ъ 


a 


else 
errargt C дут, Invalid Extension Mode for DWT! msg); 


errorC x’) 


end 

72. function [a,d] = dwtper(x,arg2.arg3) 

BRR DWTPER 用 于 计算 单 水 平 离散 一 维 小 波 变换 (周期 性 的 ) (periodized)- 

【例子 ] 

(1) [CA,CD] = DWTPER(X ,'wname! ) 

透 过 对 信和 号 矢量 (X) 局 期 性 的 小 波 分 解 (periodized wavelet decomposition? , 计 等 逼近 系数 矢量 CA MA 
节 系数 矢量 CD; 其 中 字符 串 参 数 “wname’ HET SURE BUE. 

(2) [CA,CD] = DWTPER(X,Lo _D,Hi _D), 

通过 给 定 得 滤波 器 亦 可 计算 逼近 系数 矢量 CA 和 细节 系数 矢量 CD. 其 中 输入 参数 Lo D 是 分 解 的 低 通 
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MRE ñi Hi D 是 分 解 的 高 通 滤波 器 ,Lo DHH _D 必须 具有 同样 长 度 .如 果 lx 为 信号 尔 量 (X) HKE, 
则 
length(CA) = length(CD) = CEIL(Ix/2). 
参见 DWT, IDWTPER. 
EF] 
% Check arguments. 
if errargn('¢wtper’ ,nargin,[2:3],nargout, 0:21), error( *'), end 
if nargin = = 2 
[ок _D,HiF D,LoF R.HiF R]— wlilters(arg2): 
else 
ТӘР D = arg2; НЕЮ = arg3; 


end 


% Periodization. 
Ix = length(x); 
If = lengthi LoF _ D) 
if rem(]x.2; , xC(x1) = x(bo: Ix = lx 1; end 
if six D = 一 1 

x = [0+1 09 x 1:0 
else 

x = [xv x—1+ 1: bo xix (1 10]; 


end 


34 Decomposition. 
Ip = ceil(lx/25; 
a = wkeep(dyaddown(conv(x,LoF _12)),1р)+ 
d = wkeeprdyaddown(conv(x,HiF _D)),Ip); 

73. function у = dyaddown (x ,arg2 ,arg3) 

函数 DYADDOWN 计算 二 分 的 下 采样 (Dyadic downsampling) 

【例子 】 

(1) Y = DYADDOWN(X,EVENODD), 

在 此 X 为 一 矢量 ,返回 的 矢量 Y 是 长 度 为 矢量 X 二 分 下 采样 的 结果 矢量 :整数 参数 EVENODD REE 
是 包含 X 矢量 中 的 偶数 下 标 元 素 (even- indexed samples) 还 是 奇数 下 标 元 素 (odd-indexed samples), 

如 果 EVENODD 是 偶数 , HJ YO = X(2k). 

如 果 EVENODD 是 奇数 , 则 YO = X(2k—1). 

(2) Y = DYADDOWN(X) $F Y = DYADDOWN(X,0) 

(3) Y = DYADDOWN(X,EVENODD,'type') or 

Y = DYADDOWN(X, ‘type’ ,EVENODD) 

在 此 X 是 一 个 矩阵 ,返回 值 Y Ж X 经 压缩 列 ( 或 行 ,或 行 和 列 ), 报 据 字符 串 '"rype ER "c Column Fl) 
(或 到 (row, 行 ) 或 者 "m') 而 定 .参数 EVENODD 的 意义 同 前 。 

(4) Y = DYADDOWN(X) 就 等 于 Y = DYADDOWN(X,0,’c"). 

(5) Y = DYADDOWNX,'type') 就 等 于 YY = DYADDOWN(X,D，type ). 

(6) Y = DYADDOWN(X,EVENODD) 就 等 于 了 = DYADDOWN(X,EVENODD,‘c')- 
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1 
说 明 实 例 : x =|2 
3 


DYADDOWN(,'r'.D-— | 


a = 


3 4 
6 8|, MJ DYADDOWN(X,'e') 
9 0 


1234 
3590 


参见 DYADUP. 
【程序 】 


% Check arguments. 


if errargn C dyaddown' ;nargin [1:3] nargout [0;13). error x '), end 


[т.с] = size(x); 


if min(r,c)< = 


af nargit lp = OF 


elseif nargin= “2, p = arg2; 


else ezrargt (dyaddown' ,'too many arguments’ msg"); 


errori «2; 


else 


end 


if rem (p.22, y = x(1:2;length(x)); else, y = x(2:2:length G0); end 


if 
elseif nargin= —2 
if isste(arg2). p = 0; о = lower(arg2(1))+ 
else, p = arg2s о = ‘e's 
end 
else 
if isstr(arg2), р = arg3: o = lower(arg2(1)); 
else, p — arg2s o — lowerlarg3(1)); 
end 
end 
# osse 


if rem(p,2), y = x(;, 
else, у = x(,,2:2i)i 
end 

elseif o= = 
if rem(p,2), у = х(1:2з+гә s 
else, y = x(2:2:r,:); 
end 

elseif o= —'m' 
if rem(p,2), у = x([iZirliZis 
else, у = x(2:2:1,2:2:0?; 
end 


else 
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errargt U dvaddown' ,'invalid argument value’ , msg’ ) 
errori «); 
end 

end 

74. function y = dyadup(x,arg2,arg3) 

函数 DYADUP 计算 二 分 的 上 采样 (Dyadic upsampling) , 它 通过 简单 填 零 而 使 该 过 程 在 小 波 重 构 算法 中 
非常 有 用 。 

【例子 】 

CD. Y := DYADUP(CGEVENODD) 

在 此 X 为 -矢量 ,返回 的 矢量 Y 是 长 度 为 和 关 量 X 两 倍 的 上 采样 结果 矢 量 ; 整 数 参 数 EVENODD REE 
是 在 矢量 中 的 偶数 下 标 元 素 (even-indexed samples) Xf 83 I fa л Ж (0dd-indexed sampies} 位 置 中 填 零 。 

MRM RSH EVENODD BAK, M| Y(2k—1)= ХОК), Yk) - 0. 

如 果 整 数 参 数 EVENODD 是 奇数 , M| YGk-D- 0, Y(2k) — Xk). 

(2) Y := DYADUP(X) #9 Ү > DYADUP(X.D 

(3) Y = DYADUP(X.EVENODD, type') 或 

Y == DYADUP(X туре" ,EVENODD) 

EEX B— EBE PH Y BX 经 扩充 列 ( 或 行 ,或 行 和 和 列 ) .根据 字符 捉 'type' ER c (column, YID 
GRR r (rew, 行 ) 或 者 'm' ) 而 定 。 参 数 EVENODD 的 意义 同 前 ， 

(4) Y := DYADUPOO 就 等 于 Y = DYADUP(X,1,"c') 

(5) Y = DYADUP(X,'type') 就 等 于 Y = DYADUP(X.1,'type') 

(6) Y = DYADUP(X,EVENODD) 就 等 于 Y =DYADUP(X,EVENODD,':') 


说 明 实 例 X = | ELITS R po? | 
3 4 030 40 

i2 1 ó 3: 

pyapupcx.r = |o o|, DYADUPCX.'m'.0) = i0 0 0! 

3 À 3 0 4; 


参见 DY ADDOWN. 
【程序 】 
% Check arguments. 
if errargn ("dyadup! ,nargin, [1:3],nargourt, [0:1]), error" +“), end 


[r,e] = size(x); 
mi = min(r.c); 
dim = 1; 
if mi2>1 
dir. = 2; 
else 
H — nargin==2 
if isstr(arg2) , dim =2; end 
elseif nargin 一 一 3 
if isstr(arg2) | isstr(arg3) , dim = 2; end 
end 
end 


if dim==1 
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if nargin==1,p = 15 
elseif nargin= =2, p = arg2s 


else errargt ( dyadup' , too many arguments’ ,'msg 2; error x"); 


end 

if rem (p, 2? 
1 = 2 «length GO 1: y == zeros D y(2:2;D = x; 
irm. y = уз end 

else 
1 = 2slengthGO--1: y == zeros(1,D; у(14241) = x; 
iil. y = y's end 

end 

else 
if nargi 


elseif nargin= = 2 


if isstr(arg2), p = l; 0 


else p = arg21 о = /e's 


end 
else 
if isstr(arg2), р = arg3: o = lower(arg2(1))s 
else, p = arg2: o = lower(arg3(1)); 
end 
end 
if 
if rem (p,2) 
ne = 2*c4-1; y = zeros( ne) i у(:,2:2:п0) = xi 
else 
ne = 2*c—liy zerosGr snc); уб:,1:®:пс) = xi 
end 
elseif o= =r 
if rem(p.2) 
nr = 2 reds у = zeros(nrsc)s yiZinr i) = x; 
else 
ш = 2*:—1; y = zeros(nr,c); 7(1;2:nr,:) = x 
end 
elseif o: 
if rem(p,2) 
nr = 2#r+l; ne = 2*c+1, 
у = zeros(nr,nc); y(2;2;nr,2:2 ne) = x; 
else 
nr = 2*r—1; nc = 2#c—l; 
y = zeros(nr,nc); y(1:2:nr,1:2; nc) = xi 
end 
else 


errargt(/dyadup’ ,'invalid argument value’ ,msgÜ : 
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error x"); 
end 

end 

75. function x = idwt(a,d,arg3,arg4.arg5) 

函数 IDWT НКР А Е ЕЖЕ A Bl sit AE PRK wname, 参见 WFILTERS) fA 
fr COE ERES BANE (reconstruction) 

【例子 】 

(1) X = IDWT(CA.CD,'wname' 2 

ЖЕННЯ СА 和 Ср), ÉE P| š ЖЕ ЖОН 8 Sk X Е X FASE 'wname' 用 来 选择 不 
同 得 小 波 基 ， 

(2) X = IDWT(CA,CD,Lo R,Hi Е) 

用 给 定 的 重 构 低 通 滤波 器 (Lo _R) 和 重 构 高 通 滤波 器 (Hi RR A (СА 和 CD) 来 计算 单 
水 平 重 构 逼 近 系 数 矢量 X。 

注意 :Lo RMH R 必须 是 具有 相同 长 度 的 矢量 。 

如 果 la = 《CA) 的 长 度 = (CD) 的 长 度 , 为 重 构 高 通 滤波 器 的 长 度 . 则 (XD 的 长 度 为 (2* 1a 一 1{ 一 2)- 

(3) X = IDWT(CA,CD,'wname! -LYR X =IDWT(CA,CD,Lo К.Н _R,L) 

返回 的 是 rerurn the length —L central portion of the result 

obtained using IDWT(CA ,CD,'wname'). L 必须 小 于 等 于 (2*1a--lf + 2) 

参见 DWT, IDWIPER, UPWLEV. 

【程序 】 
М Check arguments. 


if exrargn Cidwi! ,nargin,[3:5J,nargout, [0:1]), error *')» end 


if isstr(arg3) 
[LoF R,HiF _R] = wfikers(arg3, r); 
if nargin ==4 ,| = arg4s else , 1 = 2 length(a) —lengtb(LoF _R)—2 


end 
else 
ТОЕ R = arg3; HiF _ R = args 
if nargin— —5 , 1 = arg; else , | = 2* lengrh(a) length (oF ВЭ 2: 
end 
end 


М Reconstruction. 
х = conv(dyedup(a),LoF _R)+conv(dyadup(d) HiF | R); 
x = wkeepGoD; 

76. function x = idwtper(a,d,arg3.arg4,arg5) 

用 于 计算 单 水 平 离散 一 维 小 波 变换 (周期 性 的 ) (periodized)， 
函数 IDWTPER 用 于 计算 单 水 平 逆 离散 一 维 小 波 变换 (周期 性 的 )(periodized)- 

【例子 1 

(D X = IDWTPER(CA,CD; wname') 

НЕА fk OO Eh BD Cperiodized inverse wavelet transformation) ,根据 逼近 系数 矢量 
CA 和 细节 系数 矢量 CD, 计 算 单 水 平 重 构 通 近 系数 矢 基 X SARS wane’ Ят 
(参见 WFILTERS). 
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(D X = IDWTPER(CA,CD,Lo _R.Hi В) 

RH DHE BK ИЕ ЖЖ ЕИ ЕКЕ EAB ИАА ХКТ 输 人 参数 Lo _D 是 重 构 的 低 道 
滤波 器 而 Hi D 是 重 构 的 高 通 滤波 器 ,Le _D 和 Hi D 必须 具有 同样 长 度 . 如 果 

la = (CA) MK BE = length(CD) MK, MOMKE = 2> la. 

(3) X = IDWTPER(CA,CD, wname' ,L) iX X = IDWTPER(CA,CD,Lo _R,Hi КА) 

在 此 , L 为 结果 矢量 得 长 度 , 其 余 参数 意义 同 前 。 

参见 DWTPER. 

【程序 ] 
% Check arguments. 


if errargn C'idwtper" snargin s [3:5] nargout; [0:1 « error ж), end 


la = lengths 
if isstr(arg8) 
[LoF. R,HiF R] = wiltersCarg3, 5D 


if nargin— —4 , ix ~ areds else , Ix = 2 x la; end 
else 

LoF R = arg3; HIF В = arg4: 

if nargin— —5 , lx = arg5; else , lx = 2 * la: end 
end 


% Reconstruction. 
lf = length(LoF _ R); 
1р = ceil(lx/2)s 
Im = loor((lx+lf—1)/2) -1p)/2; 
аг = ceilim); 
al = floor(in ; 
if size(a,1)= —1 
a = [а(1р-а1-—-1:1р) a а(1:аг31+ 


d =: [d(p-al+1:lp) d d(1;ar)2; 
else 

а = [a(lp-al+1;p);asa(l;ar)], 

а = [d Qp-al+1:lp);d;d (l ar) ]; 
end 


x = conv(dyadup(a).LoF _R)+conv(dyadup(d) ,HiF _ R); 


wheep (x |z); 

77. function thr = thrwdald(c,1,tptr,scal,n) 
函数 THRWDAID 用 小 波 变 换 计 算 一 维 自动 去 噪 的 阅 值 。 
【例子 】 

THR = THRWDA1D(C,L,TPTR,SCAL,N) 
HATAF DRADER KAE. 

其 中 参数 ， 

N 表示 不 同 的 小 波 分 解 水 平 ; 

[C ,i 表示 小 波 分 解 结构 ; 

TPTR 列 用 于 决定 阅 值 选择 规则 ; 
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SCAL AF LAA MARE : 
‘one’ 定义 为 无 标 度 ; 
‘sin’ 定义 为 基于 第 一 水 平 系数 矢 基 品 声 水 平 单 个 估计 的 标 上 度 ， 
"mln' 定义 为 再 标 庆 , 可 用 于 不 同 水 平 的 噪声 水 平 估计 。 
这 样 , 所 得 结果 为 THR《i), 即 表示 水 平 i 的 冰 值 。 
参见 WDEN. 
【程序 了 
% Check arguments. 
if errargn (thrwdald’ „патри. [5].margout, 70.17), error w), end 
if errargt ('thrwdald! ,tptr,‘str’), error(" € '), end 
if errargt ('thrwda]d' yseal,‘str’), error(’ * ^), end 


if errargt Cthrwdald' n.'int), etror( x '), end 


1⁄4 Threshold rescaling coefficients. 

if stremp cal, one"), s = ones(1,n); 

elseif stremp(scal;'sln'), s = ones(1,n) * wnoisest (c,1, 1); 
elseif stremp(seal,'mln'), s = wnoisest(cl. 1:02; 

else 

errargt C thrwdald' .'invalid argument value’ , msg) : error + ') 


end 


% Thresholds 
first = cumsum(]) +1; first = fliplrCfirst(1 length (first) —2)); 
ld = length) —1; —152) last = first-+ld—1; 


thr = zeros( 155 


fork ~ lin 
flk +: first (К) last (k); 
if tptr 'sqtwolog! | tptr= =='minimaxi’ 
t = thselect(c,tptr); 
else 
if stk) < sqrt(eps) * max(c(flk)) 
t= 0; 
else 
t = thselect(c(flk)/s(k) «tptr) : 
end 
end % threshold. 


thr(k) = t * s(k); % rescaled threshold. 
end 
78. function thr = thselect(x.tptr) 
函数 THSELECT nr RET HERE 30 ROS. 
[AF] 
THR = THSELECT(X,TPTR) 
计算 适合 信号 矢量 X MAM RES RSM TPTR 用 米 定义 选择 的 规则 。 可 用 的 规则 为 ， 
a) TPTR = 'rigrsure', 表示 根据 Stein 的 无 偏 风 险 估计 CStein's Unbiased Risk Estimate) 原 则 ,选择 自 适 
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ЖИИ. 

b) TPTR = 'һешзше', Am HR e HME A MEPE E ТЕЛИ W] E РЕ ELE AL, (heuristic variant of the first 
option. ) 

c) TPTR = ‘satwolog’, BB ЭУ sqrt(2 * log(length(X))). 

d) TPTR = 'minimaxi' , ЖЛ КИЕЗ Е И (minimax thresholding). 

注意 , HAARLEM SHEARS ASRS E.. y = (CO + e Uh eoo BE 
FS (C e= NO, FERRARE Т У, 28 B] ЖЕРЕ E Crescaling) f B fi BH THR( 参 见 WDEN 
函数 中 的 SCAL 参数 )。 

参见 WDEN. 

【程序 】 


f errargn C thssleet’ ,nargin, [27,nargout- [0 1]), error(’ *'), end 


n = length(x!s 
if stremp (tptr.‘rigrsure’ ) 
sx2 := sort(abs(x)). ^ 2; 
risks = (n— (2 * (1 :n)) + (cumsum(sx2) + (0—1;— 1,09. ж sx2))/ni 
[risk ,best] = min (risks); 
thr == sqrt(sx2(best )) ; 
elseif stremp(tptr.‘heursure’} 
hthr = sqrt (2 x log(n))s 
eta == (norm(x). ^ 2—n)/ns 
erit = (og(n)/log(2)2  (1.5)/sqrt(n); 
if eta < crit 
thr = hthr; 
else 
thr = min (thselect(x.'rigrsure’) ,hthr)， 
end 
elseif stremp(1ptr,"sqtwolog’) 
thr == sqrt (2 * log(n)); 
elseif strcmp (1ptr»minimaxi Э 
ifn <= 32, thr = 0; 
else thr = 0. 3936 + 0. 1829 * (log(n) /log(22) : end 
else 
errargt ( rhselect , ‘invalid argument value" , msg; 
enor( x!) 
end 
79. function y = upcoef(o,x .arg3.arg4 argo arg6) 
函数 UPCOEF 可 用 于 用 一 维 小 波 系数 来 直接 重 构 分 析 信号 。 
【例子 了 
(1) Y = UPCOEF(O,X ,'wname' ,N) 
计算 矢量 X HN 步 重 构 系 数 .wname' 为 字符 串 变 量 参 数 ,用 于 选择 小 波 基 函 数 ,N 必须 是 一 个 正 整 数 。 
MRO = s, 表示 重 构 带 近 系数 ,如 果 O 一 'd' ,表示 重 构 细节 系数 (detail coefficients), 
(2) Y = UPCOEF(O,X ,'wname' ,N,L) 
计算 矢量 X 的 N 步 重 构 系数 ,并 得 到 结果 矢量 中 距 中 心 长 度 为 的 部 分 的 矢量 。 
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(3) Y = UPCOEF(O,X,Lo _R,Hi R,N) or 
== UPCOEF(O,X,Lo R,Hi _R,N,1) 
不 用 小 波 基 函 数 ,也 可 用 滤波 器 来 计算 重 构 系 数 矢 是 Х.Д 输入 参数 Lo _ D 是 重 构 低 通 滤波 器 而 
Hi _D 是 重 构 高 通 滤波 器 。 
(4) Y == UPCOEF(O,X ,'wname' ) 等 于 
Y = UPCOEF(O,X,'wname' ,1). 
(52 Y = UPCOEF(O,X,Lo _R.Hi _ R) 等 于 
:= UPCOEF(O,X,Lo _R,Hi _R,1). 
在 <4) 和 (5) 的 情况 中 ,Y 是 没有 被 截断 的 、 
参见 IDWT. 
【程序 】 


% Check arguments. 


if errargn('upcoef’ »nargin [3:6 ],;nargout,[0;1]), error( * '), end 


о = lower(o(1)); 

if jsstr (arg3) 
[LeF _R,HiF В] = wilters(arg3, 7; 
if nargin < 4, n = l; | = 0; 


else 
n = ага! 
if nargin < 5,1 = 0; else | = arg5; end 
end 
else 
LoF R = arg3; НЕ Е = агы: 
if nargin < 5, n = 15 
else 
n = агв5; 
if nargin < 6, 1 = 01 else] = arg6; end 
end 
end 


if QD | (п жб) 

errargt б upcoef’ "invalid argument value’ ,/msg’); error ж): 
end 
if (0) | C =fix(1)) 

errargt ( upcoef' ,'invalid argument value’ ,'msg'); error «25 


end 


if o= ='a' 
% Approximation reconstruction. 
Fl = LoF _R; F2 = Fl; 

elseif o= = "d 
% Detail reconstruction. 
Fl = HiF_R; F2 = LoF _R; 


else 
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errargt upcoef' "invalid argument value’ ,'msg/2: error » °); 
end 
y = conv(dyadup(x) F1); 
for k—2:n 
y = conv(dyadupG) F2); 
end 
#1, у = wkeepCy,D : end 
80. function [,1,а] = upwlevtc.l,arg3 ,arg4) 
BR UPWLEV 几 于 一 维 信号 小 波 分 解 的 单 水 平 重 构 。 
【例子 】 
O) [NC,NL,CAJ ~ UPWLEV(C,L."wname') 
执行 一 维 信号 小 波 分 解 的 单 水 平 重 构 ,从 已 得 的 [C.L ` 计算 出 新 的 水 平 的 [NC ,NL], 同时 还 得 到 最 近 
的 逼近 系数 矢量 CA。 
Ш ГС: 是 水 平 n(= length(L)— 2), 则 [NC.NL ] 大 同样 的 分 解 冬 量 ,但 其 水 平 为 n 一 1, 而 CA 则 
ЖК n 的 逼近 系数 矢量 。 
字符 串 参数 'wname' ARM BME ЖЕЙ. 
C 为 原始 小 波 分 解 矢量 ,而 二 为 相应 得 短 记 矢量 (bookkeeping vecetor), 其 详细 信息 参见 函数 
WAVEDEC, 
(2) [NC,NL,CA] = UPWLEV(C.L.Lo R,Hi RO,RJB/NUE EBS. RRR ЕЖЕН 
矢量 .其 中 输入 参数 Lo D 是 重 构 低 通 滤波 器 而 Hi D 是 重 构 高 通 滤波 器 。 
参见 ШУТ, UPCOEF, WAVEDEC 
【程序 3 
5⁄4 Check arguments. 
if errargn Cupwlev' ,nargin,[3: 4 J,nargout 0:37), error * ') , end 
if nargin === 3 
[LoF R,HiF К) = wfiherstarg3,'r 
else 
LoF R = arg3; HiF _R ~ arg4; 


end 


% Extract last approximation. 
1 = length); 

1 =1@); 

а= «1410, 


V One step reconstruction of the wavelet decomposition structure. 


Hl] > 2 
12 = 102); 
13 = (3); 
1= 102.0; 10) = 13+ 


а = cr 12702; 
le = length(? ; 
ra = idwt(a,d,LoF R,HiF К.З); 
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e 2: с01+12+1— 13:10): 


с(1:13) = ra; 
еве 

1-С, 

e= 0 
end 


81. function [с,1] = wavedec(x,n,arg3,arg4) 

函数 WAVEDEC TJ B THB £ KE BD. ERE DRE ВАВА bk r thi ЖИИ 
多 水 平一 维 小 波 分 解 

【例子 1 

(1› [C.L] = WAVEDEC(X,N, wname') 

3B BU BEAR AB k F. N К) ЖР е ЛАБ NEB RE ЛЫБ ЛЕ А 
ECM@ick a L. 

(2) [C.L] = WAVEDECOGN.Lo. D.Hi. _ D), k itta К Н Lo D 和 分 解 高 通 滤 
RHO D ERG. 


小 波 分 解 的 结构 可 表达 为 : 
C = (арр. coef. (N) |der. coef. (N) |=- Idet- coef. OO 
LCD = length of app- coef. (N) 
LG) — length of det. coef. (N—i +2) fora = 2 1 
L(N+ 2) = length GO. 
参见 DWT. WAVEINFO, WFILTERS. WMAXLEV. 
【程序 】 
% Check arguments. 
И errargn(’ wavedec’ snargin [3:47 nargou [0:22 , error *'), end 
if errargt('wavedec’ әп int ), ertor(* x '), end 
if пагвіп= = 3 
[LoF D.HiF D] = wfiltersCarga, d' 2s 
else 
Lo? D = arg3; HiF _D = агай: 


end 


34 Initialization. 
s = sizeGO: x = х(:)': % row vector 
с = []: 1 = Петр (х)], 


fork = 1:n 
[xed] = dwt(x.LoF _D.HiP р): % decomposition 
с = [de]; % store detail 
1 = (length (d) 10: % store length 
end 


% Last approximation. 


c = (xe 
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1 = [length(x) 1]; 


if s(1)2>1, c = c^; = V; end 
82. function thr = wdchm(e,l.alpha,m) 
函数 WDCBM 用 Birge-Massart 策略 对 一 维 分 析 信 号 去 品 和 压缩 
【例子 】 
(D THR = WDCBM(C,L,ALPHA,M) 
用 Birge-Massart % w Л], tk Ж Sk e FE 800489 2) + IE] ZKOE B ЖИ i A FRR CL) 是 分 析 
信号 的 小 波 分 解 结构 . 
字符 申 参 数 ALPHA 必须 是 大 于 1 的 实数 ,一 般 说 来 , 当 ALPHA = 1. 5 时 表示 压缩 ,而 当 ALPHA = 3 
时 ,表示 去 品 , 参 数 M 是 一 个 正 整数 , 当 M 一 L4H)72 时 ,最 粗糙 的 通 近 系数 矢量 的 长 误 大 于 2。 
(2) WDCBM(C.L.ALPHA) 就 等 于 WDCBMCC.L. ALPHA 1022). 
参见 WDEN, WDENCMP, WPDENCMP. 
【程序 】 
X Cheek arguments. 
if errargn(’ wdebm’ ,nargin, [2:4], nargout,_0 1_), error( +"). end 
if errargt(’ wdcbm’ ,alpha—1,'rep’), error(’ +"), end 
if nargin= —4 


if erracgt(’wdcbm’ ,m ,‘int’), error *'), end 


else 

m = ](1)/2; % the number of detail coefs at level j0 — 1. 
end 
10 = length(1)-- 2; % low frequency cutoff. 


% Wavelet coefficients selection. 
for j~1:i0 
% number of coefs to be kept. 
n = 中 /(j0 十 1 一 D) ` alpha; 
n = min(round(n),1Gj0—j+-2)); 
% threshold. 
ifn == 1j0-j+2) 


thr(j) = 0; 
else 

d = deicoef (cili); 

d = sort(abs(d)); 

thr(j) = d(length(d)--n); 
end 


end 

83. function [xd,cxd,Ixd] = wden(in1,in2,in3.in4,in5.in6,in7) 

函数 WDEN Bi BOR B oh ot 4 ams SET EMR 

【例子 】 

G) (XD,CXD,LXDj = WDEN(X, TPTR,SORH,SCAL N, wname' ) 

НЛ ЕКИ ТЮ ТУНА E [CXD,LXD NJ WM T H 
分 析 信和 号 矢量 的 小 波 分 解 结 构 。 FARER TPTR 则 用 于 决定 阔 值 选择 规则 : 
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TPTR 可 用 的 规则 为 : 


a) ТРТЕ = 'rigrsure， 表 示 根 据 Stein f JG fg PUE ff E] Stein s. Unbiased Estimate) 原 则 ,选择 自 适 
RE. 

b) TPTR = 'heursure . ЖЕЕ М Ж B ИЕ ЖЕ dE 4E BR B| BE Н 87 PIAL, heuristic variant of the first 
option. 

c) TPIR = 'sqtwolog! , BUB sqrt (2 * log length OO 2. 


d) TPTR ~ 'minimaxi' , BMRA {EGE EU Oninimax thresholding). 
(参见 HSELECT 函数 ,可 得 更 详细 信息 )， 
заж БОВ (s! or 'h') MARERA KAEN ARROL WTHRESH 函数 ,可 得 更 详细 信 
8). 
Fe RSW SCAL APE LAR HERE: 
fone’ 定义 为 无 标 度 ; 
‘sl! 定义 为 基于 第 -水平 系 数 矢 量 噪声 水 平 单个 估计 的 标 度 ; 
‘mln' 定义 为 再 标 度 ,可 用 二 相同 水 平 的 咯 声 水 半 估 计 。 
参数 和 表示 不 同 的 小 波 分 解 水 平 ， 
字符 审 参 数 ' wname' 则 用 于 定义 不 同 正 交 小 波 基 琐 数 - 
(2) [xD,CXD,LXD] = WDEN (C.L, TPTR.SORH ,SCAL,N, wname') 
ИНОМЖАН СЛ, ИЖИ АЕ ЖЯ X. Ab EB ER 
参见 THSELECT, WAVEDEC, WDENCMP, WFILTERS. WTHRESH. 
【程序 了 
% Check arguments. 
if nargin= =7 


if errargn (wden’ ,nargin, [7 ],nargout, [0:35) 


ertor( ж 7 
end 
ce:=inls 1=in2; tptr—in3; sorh=in4; scal—in5; a=m6; win7; 
else 
if errargn(! wden’ snargin. [6] nargout, [0:3]). error(’ +). end 
x=inl; tptr=in2; sorh=in3; scal=inds n=in5; w= in6; 
end 


if errargt C wden’ ,tptry str! ), error € 2, end 
if errargt('wden’ ,sorh,’str’), error(* ж '), end 
if errargt(’ wden’ ,scal,'str') , error(’ *'), end 
if errargt C wden' .n int), error( ж'), end 


if errargt (‘wden’ iw "str. error ж '), end 


44 Wavelet decomposition of x- 


[2.1] = wavedee(x,n,w)+ 


end 


% Threshold rescaling coefficients. 


if stremp(scal, one), в = ones(1,n2; 


elseif stremp(scal,‘sln'), s = ones(1 +n) * wnoisest(c+1,12+ 
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elseif stremp (scal, mln’), s = wnoisest(c.],1;n); 

else 

errargt C wden' yinvalid argument value’ ytnsg' Ji error *‘) 
end 


Ж Wavelet coefficients thresholding. 
first = cumsum(1)+ 1i 

first = fliplrfirst(1;length (first) —2)); 
ld = l(length() —1; 21:254 

last = first-Fld —1; 


cxd 


Ixd n 
fork = 1:n 
fk = firsu(k);last(k); 
if tptr-= —'sqtwolog! | tptr==‘minimaxi! 
thr = thselect(c,tptr); 
else 
if s(k) < sqrt(eps) + max(c(flk)) 
thr = 0; 
else 
thr = thseleet(e(f#lk)/s(k),tptr); 
end 
end % threshold. 
thr = thr x s(k)s % rescaled threshold. 


сха) = wthresh(c (fk), sorh-thr); % thresholding or shrmking. 


end 


У Wavelet reconstruction of xd. 
xd = waverec(exd,Ixd,w); 

84. function [xc,cxc,lxc,perf0,perfl2] = … 

wdenempto,in2 ,in3 ,in4 ,in5 ,in6 ,in7 ,in8) 

函数 WDENCMP WT ERT ARSE — S RA ЖТ HE a, 

【例子 】 

(1) [XC,CXC,LXC,PERFO,PERFL2; = WDENCMP(gbl .X.'wname! .N, THR.SORH.KFEPAPP) 

2 88 ЖОШ pt 33 ¿JN Ж SS BEL E $ REMH ТНК, ТА Э ДЕРЕ XC 及 附加 的 输 
H ABR CXD,LXD], E [Db EM T GH А ЖОР AY JW BY, RUBRI TPTR 则 用 于 决定 
PEL ЖЕЙИН. 2508 4-4 H BH PERFL2 和 PERFo 分 别 表示 2? 范 数 回收 (recovery) 和 压缩 率 ,其 中 : 

PERFL2 = 100 * (vector-norm of CXC /vector-norm of C) ^ 2 

式 中 的 [CU] 表示 分 析 信号 的 小 波 分 解 结构 。 

输入 参数 ， 

X 为 原始 数据 ; 

“wname' 为 所 选 小 波 函数 名 ; 

N 为 分 解 水 平 ， 

THR 44 FE Bas 
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字符 申 参数 SORH 为 除 噪 模式 ,可 能 取信 为;'s or “hs 
如 果 参 数 KEEPAPP = 1, 则 表示 通 近 系数 不 被 取 阅 值 ,其 余 则 可 能 。 
(2) WDENCMPCUgbl' CLW, N, THR ,SORH,KEEPAPP) 
与 上 例 效果 同 , 唯 一 不 同 之 点 在 于 本 调用 没有 用 原始 数据 X тЇ e Ht aT [CL 
(3) 对 -一 维 信 号 而 言 ,如 采用 'lvd' 选择 而 不 是 'gbl 时 ,如 下 而 两 例 ， 
WDENCMP ('lvd' , X, ‘wname’ ,N, THR,SORH) or 
WDENCMP (а ,C,L , "wname! ,.N, THR,SORH) 
也 可 得 前 述 两 例 的 结果 ,此 时 输入 参数 THR 必须 为 一 矢量 , 即 包 含 了 所 有 水 平 所 需 阅 值 ,此 外 ,还 保持 
TREDE. 
(4) 对 一 维 信 号 而 言 ,如 采用 'lvd” 选择 而 不 是 'gbl 时 ,如 下 调 两 例 ，: 
WDENCMP С ,Х, "wname' ,N, THR ,SORH) or 
WDENCMP (lvd' ,C,L, пате" ,N,THR,SORH) 
可 得 前 述 例子 的 相同 结果 ,但 此 时 输 人 参数 THR 必须 为 -矩阵 (3XN), 即 包含 了 三 维 方向 的 所 有 水 平 
яе. 
参见 DDENCMP, WAVEDEC, WAVEDEC2, WDEN, WPDENCMP, WTHRESH. 
【程序 】 
J£ Check arguments and set problem dimension. 
dim = 15 М initialize dimension to 1D. 
ifo == "вЫ 
if errargn(' wdenemp' ,nargin [7:8], nargout, 70:1 3:57), error ж), 
end 
if nargin 77, x —in2; w—in3; n—in4; thr=in5; sorh--in6: keepapp—in?; 
if min (sizeGO) ~ —1, dim = 2; end 
else, c—in2; l—in3: wind; n—in5; thr—in6; sorh —in?; 
keepapp=in8; 
if min(size(1})~- =1, dim 一 2; end 
end 
elseif o = — "ка" 
if errargn(wdencmp’ nargin [6:7] nargout [0:1 3:51), error « D. 
end 
if nargin==6, x—in2: w—in3; п=іп4; dy—in5; sorh — in6; 
if min(size(x))— =1, dim = 2; end 


else, c—in2; 1=in3; w=ini; in5; thr=in6; sorh —in?: 


if min(size(D)7- — 1, dim = 2: end 
end 
else, errargt  wdencmp' , invalid argument value’ ,'msg 2; error ж э 
end 
if errargt (' wdenctnp' ,w, str), error * '), end 
if errargt  wdencmp' ,n,'int'), error{' *'), end 
if errargt ( wdencmp' sthr,’ ref), error x’), end 


if errargt C wdencmp' ,sorh,‘str’), error(’ * '), end 


% Wavelet decomposition of x Gf nor given), 


И (o= ='gbl' & nargin = 7) | (o= —'Ivd' & nargin= —6) 
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[el] = wavedec(x,n,w); 


[с,1] = wavedec2(x,n,w); 


end 


% Wavelet coeflicients thresholding. 
if o= = 
if keepapp 
% keep approximation. 
exe = c; 
if dim == 1, inddet = 1(1) +1 :length(c)s 
else, inddet = prod((14:)? -1 :length(c); end 
Yi threshold detail coefficients. 
exe(inddet) = wthresh(eCinddet) ssorh thr) ; 
else % threshold all coefficients. 
exc = wthresh(c,sorh chr); 
end 
else 
if dim == 1, exe = wthcoef Ct! ,0,1,1:n,thr,sorh); 
else 
схе = wiheoef2 Ch! ,csl, 1n (1, :) зо); 
exc = wthcoef2Cd' excl. 1;n ihr (2, D ssorh s 


= wthcoefZCv' ,cxesli ln,thr(3,:) ,sorh); 


š 
š 
| 


end 


% Wavelet reconstruction of xd. 


if dim == 1, xe = waverec(cxe, lxe,w); 
else xc = waverec2(cxc,]xc,w); 
end 


if nargout<4 , return; end 


14 Compute compression score. 
регіо = 100 + (length (find (cx 


if nargout<5 , return; end 


0) length (exe) s 


24 Compute L ^ 2 recovery score. 
perfl2 = 100 x ((cxc ж exe! / cx es 
85. function [out1,out2,out3,out4,out5,out6,out7,out8] = wiilters(wname ,o) 
函数 WFILTERS H HARB Й (Wavelet filters). 
【例子 】 
а) [LO D.HI D,LO R.HI, R] = WFILTERS( wname') 


计算 不 同 正 交 或 双 正 交 的 小 波 函 数 的 4 个 滤波 器 ， 
此 4 个 滤波 器 为 : 

LO D. Ad GE IE 8; 

HI D, 分 解 高 通 滤波 器 

LO R. 重 构 低 通 滤波 器 

НІ_К, аяа. 

可 用 的 小 波 函 数 为 : 


% Daubechies ; ‘dbl’ or ‘haar’, "db2', = '4Ь50' 
Ш Cofles : "сой1', з,  'сойУ 
% Symlets —: ‘sym2/_,+-'sym8" 
% Bierthogonal; ‘bior]. | , 'biorl. 3' , 'biorl. 5' 
и 'bior2. 27, 'bior2.4', ‘bior2. 6", 'bior2, 8' 
% 'biord. 17, 'bior3. 3! , 'bior3. 5", ‘bior3. 7' 
% 'bior3. 9' , "biorg. 4',"biors. 5°, "morb. 8'. 
(2) [F1,F2] = WFILTERSCwname' ,’type’) 
可 用 于 计算 两 个 滤波 器 ， 
如 果 ‘type’ = '4' (分 解 滤波 器 ), 则 得 到 LO D and HI D 


HE ‘type’ = 'r"( 重 构 滤波 器 ), 则 得 到 LO_R and HI _R 
SUR ‘type’ = '1' 〈 低 通 滤 波 器 ), 则 得 到 LO _D and LO К 
SUR ‘type’ = 'h' (高 遵 滤 波 器 ), 则 得 到 HI _D and Hi К, 
参见 BIORFILT, ORTHFILT, WAVEINEO, 
【程序 
1⁄4 Check arguments, 
if errargn('wfilters' ,nargin, [1 2],nargout [0 1 2 4 8]), error( *'); end 


if errargt  wfilters' ,wname, 'str’) , error(' *'), end 


wname deblankl (name) ; 
[wtype fname] = wavernngr info! ,wname); 
mat f = findstr(’. mat’ fname): 
if mat _ í 
err = 0; 


evalc['load ' пате], елт = 14); 
if err 
msg = [‘invalid wavelet file / fname]; 
errargt('wfilters' ,msg,"msg'); 
error *'); 
return; 
end 


end 


=1 % orth. wavelet 


if муре 
if ~ssempty(mat D 
F = eval(wname); 


else 
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F = feval(fname,wname) : 
end 
[LoF D,HiF D,LoF _R,HiF ВО 一 oitbfil (F): 


elseif wrype= -=2 M biorth. wavelet 
if isemp:y(mat _ D 
[REDE] = feval (fname wname) : 


else . 
if exist Rf) —1 | exis Df 一 一 
msg = ['invalid biorthogonal wavelet file , ' fname]; 
errargt( wfilters' msg, msg’); 
error( *'): 
end 
end 
[LoF D.HiF _D1,LoF R1.HiF R.LoF DZ.HiF D.LoF R.HiF R2] = += 
biorfil (DE, Rf, 1); 
out5 == LoF _ D2; out6 ~ HiF Dl; 
out? == LoF КІ: out8 = HIF _ R2; 
end 
if nargin= = 
outl == LoF D; ош2 = HiF D; out? = LoF _Ri out4 = HiF К, 
else 
о = lower(o(1))， 
if o= ='d* , ош = LoF _ D; out? = HiF Di 
elef = o==' , out] = LoF К: out2 = HiF R; 
eleif о= = , out] = LoF _ D; out2 = LoF В: 
eleif — o——'h' , outl = HiF _ D; out? = HiF К; 
else 
errargt(’ wfilters’ ,'invalid argument value’ msg: — error «D; 
end 
end 


86. function y = wkeep(x,arg2,arg3) 
函数 WKEEP 可 用 于 保存 -个 矢量 或 一 个 矩阵 的 一 部 分 。 
【例子 】 
OO 对 于 矢量 分 析 信 号 X; Y = WKEEP (X, L, O) 
将 得 到 矢量 Y， 其 中 工 为 其 长 度 .字符 申 参数 ODM o T A r 分 别 表示 阅 是 取 自 矢量 X 的 中 部 、 左 
边 部 分 和 右边 部 分 。 
(2 Y = WKEEP(X,L) 就 等 二 Y = WKEEFP(X,L,'e'). 
(3) 对 于 矩阵 信和 号, Y = WKEEP(X ,S) 
将 得 到 新 矩阵 Y， 表 示 取 自 矩阵 X 的 中 部 ， 其 中 参数 S 表示 Y 的 大 小 。 
【程序 】 
94 Check arguments. 
if errargn C wkeep’ ,nargin, [2:3] nargout.£0:1]). error *'), end 
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[re = size(x); 
у= х; 


if min(r,c) 


Ix -= length(x); 1 = arg2; 
if @>=0) & (Ebo & 1 = = fix(1)) 


—2, o = cs else , o ~ lowerlarg3(1))s end 


if nargin 


if o= s'e" 
d = (х—/2; y = y(1—oor(d):lx-cetl(d)): 


elseif o= у = yids 


elsif о" , y = уйх—1—141х)› 
else 
errargt (’wkeep’ ,'invalid argument , msg!) ;error( * '); 
end 
end 
else 
sx = size(x); s = arg2(:)'s 
K -= find sos 
(К) =sx(K); 
m = find (s < 0) | (s ~= Нх(8)))+ 
if isempty(m) 
ss = (sx—s)/2; 
first = 1+floor(ss); 
last = sx—ceil(ss) ; 
y first D :last (1) first (2) slast (2) 5 
end 
end 


87. function [x,xn ] = wnoise(num,n,snrat,init) 

函数 WNOISE 可 用 于 产生 一 个 含 噪声 的 小 波 去 品 的 检测 矢量 . 

【例子 了 

OD) X = WNOISE(NUM,N) 

将 得 到 -~ 个 检测 矢量 .参数 NUM 表示 不 同 的 常用 于 小 波 分 析 中 的 知名 函数 : 


NUM = 1 Blocks 函数 
NUM = 2 Bumps 函数 
NUM = 3 Heavy sine 函数 
NUM = 4 Doppler 函数 
NUM —5 Quadchirp 函数 
NUM = 6 Mishmash 函数 


该 检测 矢量 X 的 长 度 为 2 N. 

(2) [X,XN] = WNOISE(NUM.N,SNRAT) 

82) EM BEX ,其 标准 偏差 为 , stdCX) = SNRAT, 另 一 个 矢量 XN 为 一 个 在 矢量 X 上 附加 了 
一 个 均值 为 等 ,方差 为 1 的 高 斯 白 噪 声 , 即 N(0,1), 这 样 ,矢量 XN K fi R H (signal-to-noise ratio) 就 是 
SNRAT. 

(3) [X.XN] = WNOISE(NUM,N,SNRAT,INIT) 
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将 得 到 前 述 两 个 检测 矢量 X MXN, 新 增 参 数 INIT 表示 广 生 随机 矢量 XN WHF (seed). 
参见 WDEN. 
【程序 】 


if nargin= 


2 
if errargn C wnoise’ ,nargin, [2] ,nargout , [0 1]), error(’ x'), end 
else 

if errargn C wnoise! ,nargin,[3:4],nargout ,[0,2], error(’ * 'У, end 


end 


t=[0.1 0.13 0.15 0.23 0.25 0.40 0.44 0.65 0.76 0.78 0.813; 
h-[4 —5 3 —4 8 —42 21 43 -$1 51 —42] 


if num—= = % blocks. 
tt—linspace(0,1,2^ n); x=zeros(1.length(tt)) ; 
for j= 1:11 
x = x + ( hG) ж Go signCt-t6))/2); 
end 
elseif num—==2 % bumps. 
h=abs(h); 


w=0.01* [0.5 0.5 0.6113110.50.8 0.57; 

tt—linspace(0,1,2^ n); x=zeros(1.length(tt}); 

for j= 1,11 

x = x + CAD + Gi -tQD/wQD. ^ д), 

end 
elseif пшп==% % heavy sine, 

x—linspace (0,1,2^ n); 

x = віп w pix x) — sign(x—0.3) — вірп(0.72—х), 
elseif num — — % doppler. 

x-—linspace(0,1,2^ n); 

epsil := 0.05; 

x = sqrt(x. # (1—x)) . x sin( 2 * pi * (1+epsil) . / Gctepsil) Эз 
elseif num 一 一 5 % quadchirp. 

tz linspace(0,1,2^ n); 

x = sinC (pi/3) #0. * (2^n * L^ 22; 
elseif num = = 6 % mishmash. 

t—linspace(0,1,2^ n); 

x = sin( (pi/3) #6. * (27 n« 172% 

x = x + sin( pi* (2^ nx 0.6902) * t); 

x= x+ sinC pis t. * (2^n 0125" 00, 
else 

errargt (’ wnoise’ ,'invalid argument value’ , msg"); 

error x) 


end 


if nargin> 一 3 


x = (xx (snrat/std(x))); 
if nargin — —4, randn(’seed’ init); end 
xn — x + randn(1,2 n); 
end 
88. function stde = wnoisest(c,l.s) 
ЮС WNOISEST 可 用 于 估计 一 维 小 波 系数 矢量 的 噪声 。 
【例子 了 
STDC = WNOISEST(C,L,S) 
计算 细节 系数 矢量 的 标准 偏差 ， 
[C.L] 为 小 波 分 解 结构 (参见 WAVEDEC 函数 ). 
BS AR YET (estimator) ERAEN 48 ЗЕ (Maximum Absolute Deviation/0. 6745,8 @ = Et S #398 
SGM (BW THSELECT 8). 
参见 THSELECT, WAVEDEC, WDEN. 
【程序 了 
X Check arguments. 


if errargn (‘ wnoisest! ,nargin, [3] nargout [0:172 » error( x '), end 


птах = length}; nmax = rmax— 2: 
first = cumsum (D +1; 

first = fliplrCirst (1 :length (first) --2))4 

ld = Krmax—-1;— 1:2); 

last = first-tld— 1; 


for k = tylength(s) 
flk == first (e(k)) slast (sk>; 
stdetk) == median (abs(e(flk)))/0. 6745; 

end : 

89. function x = wrcoef(o,c.lsarg4,arg5,arg6) 

BUR WRCOEF 用 于 从 一 维 小 波 分 解 结构 (C H L), ЯЙ ERE E 3: RR (wname' ), 或 特定 重 构 滤波 器 
(Lo, R and Hi .R 进行 重 构 系数 矢量 计算 。 

[5/71 

(1) X = WRCOEF type CL. пате ,N) 

表示 基于 小 波 分 解 结构 LC,L] (参见 WAVEDEO ,及 相应 的 小 波 基 沙 数 'wname' ,计算 重 构 系 数 矢 县 X。 
其 中 参数 N 表示 水 平 ;字符 串 参 数 'type' = 'a 表示 通 近 系数 :而 'type' = "表示 妖 节 系数 矢量 。 

注意 : 当 'type' = "s BESN 可 以 为 9, 对 于 其 他 别 的 情况 N 一 定 得 是 正 整数 ,而 且 N <= length(L) 一 2 

(2) X = WRCOEF (уре ,CL ,Lo _R,Hi _ RN) 
表示 用 重 构 高 通 滤波 器 (Hi _R) 和 重 构 低 通 滤波 器 (Lo _R) 同 样 可 计算 重 构 系数 矢 县 X, 其 余 参数 同 前 。 

(D X = WRCOEF (type’.C.L,'wname’) X X = WRCOEF (/type’ ,C,L,Lo _R,Hi В) 
表示 所 得 的 重 构 系数 矢量 X, 具 有 最 高 水 平 数 N 一 (L) 的 长 度 一 2。 

参见 APPCOEF, DETCOEF, WAVEDEC. 

【程序 】 
% Check arguments. 
if errargn wreoef’ ,nargin, [4:6] ,nargout, [0:1]), error #1}, end 


о = lower(o(1)); 
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rmax = length(); nmax = rmax 一 2 
if 
if isstz Carga) 

Clo R,.HF RJ = wfilters(arg4,'r'); 


=a! , nmin = 0; else , nmin = 1; end 


if nargin —— 5, n = arg5; else, n ~ nmax; end 
else 

LoF R = агай; HiF _R = args; 

if nargin = = 6, n = arg6; else, n = nmax; end 
end 


if (n<nmin) | (n>nmax) | (n~ =fix(n)) 
errargt ( wrcoef" ,'invalid level value’ ,'msg/); error( *'): 


end 


imin = rmax —n; 
if o=="af 
% Extract approximation. 


x = appcoef(c,l,LoP R.HiF, Ryn); 


% Approximation reconstruction. 


for k 


m 
s = lGmin ck): 
x = wkeep(conv(dyadup(x) .LoF RO s): 


end 


elseif o= ='d’ 
% Extract detail coefficients. 


x = detcoef(c tn); 


% Detail reconstruction. 
s = lGmin-+ 1); 
x = wkeep(conv(dyadup(x),HiF _ R),s); 


for k=2:n 
s = Iimint+k)s 
х = wkeep(conv(dyadup(x),LoF | R),s); 


end 


else 
errargt (‘wrcoef’ yinvalid argument value! »’msg'); error( » D; 
end 
90. function m = wrmcoef(o,csl,arg4.arg5 ,arg6) 
函数 WRMCOEF 用 于 从 一 维 小 波 分 解 结 构 得 到 重 构 系 数 矢 量 矩 阵 。 
【例子 3 


(1) M = WRMCOEF(O,C,L,W,N) 
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表示 基于 小 波 分 解 结构 [C,L] (BR WAVEDEC) Ж RE BI DEAE UC w ,计算 重 构 系数 矢量 矩阵 M. 
其 中 参数 N RAKE SHSM type 一 “a' 表 示 通 近 系 数 ;而 'type = ' 册 表示 网 节 系数 矢量 。 
1) ‘type’ = гага, № 可 以 为 0, 对 于 其 他 别 的 情况 ,N 一 定 得 是 正 整数 ,而 且 N <= length(L) —2- 
2) WER M 为 重 构 系 数 矢量 短 阵 , 它 是 按 行 来 进行 排列 的 。 
(2) M + WRMCOEF(O,C,L,Lo,Hi,N) 
表示 用 重 构 高 通 滤波 器 (Hi) 和 重 构 低 通 滤波 器 (Lo)? 同 样 可 计算 重 构 系数 矢量 矩阵 M。 其 余 参 数 同 前 。 
(3) M = WRMCOEF (O, C, L, W) 或 
M = WRMCOEF (O, C, L, Lo. HD 
表示 重 构 系数 矢量 矩阵 M 含有 所 有 可 能 水 平 的 重 构 系数 矢量 。 
参见 APPCOEF, DETCOEF, WRCOEF, WAVEDEC. 
【程序 】 
% Check arguments. 
if errargn Cwrmcoef', nargin, [4: 6], nargout, [0: 12). error ( x D, end 
о = lower (o (1))s 
rmax = length (D; nmax = rmax- 25 
if o=='a', nmin = 0; else , nmin = 1; end 
И isstr (arg4) 
[LoF R. НЕК 


wfilters (arg4,'r'); 


if nargin == 5, n = arg5i else, n = [nmin: nmax]; end 
else 

LoF R = arti HiF _ R = arg5; 

if nargin == 6, n = атаб; else, n = [nmin; nmax]; end 
end 


if find ( (n<ntnin) | (n>nmax) | (n— =fix (n))) 
errargt (/wrmcoef’ "invalid level (s) value (s)'s'msg’); error C «2; 


end 
% Initialization 
if ше Q, D >1,c=cs1=1'; end 


m = zeros (length (n), 1 (rmax))s 


DELI 


for p = nmax: —1: 
Ге, 1, а] = upwlev (c, 1, LoF В, HiF_R): 
j — find (p==n); 
ifj 
36 Approximation reconstruction. 
imin = length (D —p; 
for k=1: p 
s —] (mint; 
a = wkeep (conv (dyadup (a), LoF RO. s); 
end 


а = а (ones (size ())),:); 
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m G.) = а; 
end 


end 


elseif o= —'d' 
forf = 1; nmax 


find (р==п); 


% Extract detail coefficients. 


d = detcoef (c, 1, p 


Detail reconstruction. 
imin = rmax— p: 
s= 1 Gmin+1); 
d = wkeep (сопу (dyadup (d), HiF R), s); 
fork=2; р 
s= 1 Gmintk)s 
d = wkeep Conv (dyadup (d), LoF R), s); 


end 
d = d (ones (size ()),:): 
m Gs:) = d; 

end 


end 


else 
errargt Cwrmcoef' ,' invalid argument value’ msg/)s error (ж; 
end 
91. function y = wthresh(x,sorh,t) 
Й WTHRESH $447 3k (soft) SUR (hard yk BUA. 
Y = WTHRESHOGSORH, T) 表示 对 分 析 信号 矢量 X RIMES MH X 进行 以 参数 T ORR 
MAC SORH = 's RAR AYE Gin SORH = 'ho 运算 。 
【例子 ] 
(1) Y = WTHRESH(X,'s' T) 
所 得 结果 为 Y = SIGNCO. (IX|-T)+, Bo CUR E E 
(2) Y = WTHRESH(X,'h’.T) 
所 得 结果 为 Y = X.1 OXIID 04+, MIEREA. 
参见 WDEN, WDENCMP, WPDENCMP. 
【程序 3 
% Cheek arguments. 


if errargn C wthresh' ,nargin,(3],nargout.[0:1]), error +"). end 


Й 
s 


if sorh— 
tmp := (abs(x)—t); tmp = (tmp~+abs(tmp))/23 


y = sign(x). * tmp; 


elseif sorh= ='h' 
y == x, * (abs(x)2>t); 
else 
errargt( wthresh' ,” invalid argument value! ,'msg'), error *') 


end 


92. function [a], a2, a3] == simuff (p, wl, bl. fl, w2. b2, f2, w3, b3. 


函数 SIMUFF 用 于 模拟 前 传 网 络 SIMUFF 函数 最 高 可 模拟 二 层 网 络 。 

【例子 】 

(1) SIMUFF(P,W1,B1, Fl'...,Wn,Dn, Fn) 

其 中 参数 : 

了 为 包含 输入 列 尔 量 的 矩阵 ， 

Wi 为 包含 第 i 层 的 权重 和 矩阵; 

Bi 为 包含 第 i 层 的 偏 置 列 矢 量 ; 

字符 串 参 数 Fi 为 第 1 层 的 转换 函数 ; 

该 函数 返回 第 n 层 的 输出 。 

(2) [A1,A2,...] = SIMUFF( WI Bl FL Wn Bn, Еп) 

输出 参数 Ai 为 第 i 层 的 输出 。 

(3) 使 用 示例 ; [w] b1,w2,b2] := пСО 10; 一 5 3],3，tansig' ,2，purelin ); 
p= (2; —3]: 
a = simuff(p,w1,bl, 'tansig! ,w2,b2,’purelin’ ) 

参见 INITFF, TRAINBPX, TRAINLM. 

【程序 } 


fall([4 7 10] ~ = nargin) ,error( Wrong number of input arguments") ,end 


if nargin = = 4 


al = feval(fl,wl1* pbl); 


elseif nargin == 7 
al = feval(fl.wl x p,bl); 
aZ 一 feval(f2, w2 * al.+b2); 


if nargout <= 1, al = a2; end 


elseif nargin == 10 
al = feval(fl .wl * psb1); 
а? = feval(f2,w2 * al,b2); 
a3 = feval(f3,w3 * a2,b3); 


if nargout <= 1, al = a3; end 


end 
93. function [w1,b1,w2,b2,w3,b3] = initff(p,s1,f1,s2,f2,s3,73) 
函数 INITFF Inititialize 对 三 层 及 以 下 的 前 传 网 络 进行 初始 化 。 
【例子 1 
а) [W1,B1, 
输入 参数 ; 
PH dr di лаж В RX ZEE matrix of input vectors. Si 为 第 i 层 的 大 小 ; 


= INITFF(P,S1, FL1 .Sn Ем 
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f3) 
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найн НЙ. 

输出 参数 : 

Wi 为 第 1 层 的 权重 矩阵 ; 

ВУЖ BOMBER 

OG) [W1,B1,] = INITFE(P,S1,'F1', T, Fn) 

其 中 :了 为 包含 目标 矢量 的 SnxQ BEBE MESTRE ИБ EE RU BI. 

注意 ; 矩阵 的 等 一 行将 必须 包含 第 i 层 的 输入 的 最 小 和 最 大 值 。 

СЗ) RAKA: [W1,b1,W2,b21 = inidf([0 10; - 5 5], 
p= [4;- 1]; 

= simuff(p,W1,bl,'tansig’, W2,b2, purelin’) 

参见 SIMUFF, TRAINBPX, TRAINLM 


【程序 了 


af all([3 5 7] ~ = nargin),error( Wrong number of input arguments’ ) .end 


tansig’.3,’purelin’); 


> 


[R,Q] = size(p); 


uf (Q < 2), errər( P must contain at least two elements in cach row. ') ,end 


if nargin == 3 
[S,QJ = size(s1); 
if max($,Q) > 1, 81 = S; end 
ж1,Ь1] = feval(feval(f1,'init) 51,5) а 


elseif nargin == 5 

[1,Ь11 = fevalCfeval(f1,’init’),s1.p)+ 
х = ones(s1,7) ж feval(fl,'output’); 
S.Q] = sizeis2); 

if max(S.Q) >> 1, s2 = S; end 
w2.b2] = feval(feval(f2,'init ) 52,325 


elseif nargin == 7 

wl+b1] = feval(feval(f1.'init’).s1.p); 
х = ones(s1.1) ж feval(f1,’ourput’); 
(w2,b2] = feval(feva] ({2,"init') 482.2); 
х = ones(s2.1) * feval(f2,'output'); 
5,07 = size(s3); 

if max (S.Q) = 1, s3 = S; end 
w3,b3] = fexal(feval(f3.'init ),53,x); 


end 
94. function [a,b,c,d,e,f,g,h] = trainbpG,j, k,l m,n.o;poqor,s,O 


函数 TRAINBP 用 误差 反 传 来 训练 前 传 网 络 ,TRAINBP 函数 可 调用 权重 和 偏 置 来 训练 三 层 前 传 网 络 。 
【例子 】 


[WI,Bl,W2,B2,%,TE,TR] = TRAINBP(WI,B1,F1.W2,B2,F2,-.,P T TP) 
输入 参数 : 
Wi 为 第 i 层 的 (SixR) 阶 的 权重 矩阵 ; 
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Bi 为 第 BA (SLL) Brin B s| Se t, 

字符 申 参 数 Fi 为 第 i 层 的 转换 函数 ; 

P 为 包 各 输入 矢量 的 (RxQ) 阶 的 输入 条 阵 ; 

TARR REREH (ЗОНА, 

TP AW RBH TE. 

输出 参数 : 

Wi 为 新 权重 ; 

Bi 为 新 偏 置 ; 

TE 为 实际 的 训练 数目 ， 

TR 为 训练 记录 。 

可 供 选择 的 训练 参数 ， 

TP(1) 为 显示 之 间 的 训练 数目 ， 芒 置信 为 25, 

TP(2) 为 训练 的 最 大 数目 , MEE H100. 

TP(3) 为 平方 误差 和 目标 ， 预 置 值 为 0. 02. 

TP(4) WEB (Learning rate)， 预 置 值 为 0. 01. 

设 给 训练 参数 的 都 将 采用 预 冒 值 。 

参见 INITFF, SIMFF, TRAINBPX. TRAINLM. 
【程序 】 


if all € [5 6891112] ~= nargin), error (Wrong number of input arguments’). end 


if nargin == 5 


(as bs c, d] = tbpl G, ji ky L m); 


elseif nargin = 
[ay b, c. d] = thpl G, j k. 1, m, n); 


elseif nargin == 8 
[as b. c. d, e, f] = thp2 G, j, k, 1, me n, o. p); 
elseif nargin = — 9 


[as by e. d, e, f] = tbp2 G, je ky 1, m, n o, P ads 
elseif nargin = = 11 
[ay by c. d, е, fy gy h] = tbp3 G, jy ke Ly me по os py дету 8 
elseif nargin == 12 
[ar by c. di e, f. g. h] = tbp3 G, j. k, lo m, n. o, pe qe re в D): 
end 
95. function [a,b,c,d,e,f,g,h] = trainbpx(i.j,k.l,m.n,o,prqsr Sst) 
函数 TRAINBPX 采用 快速 误差 反 传 来 训练 前 传 网 络 , 可 以 训练 一 层 、 二 层 、 最 高 可 以 训练 到 二 层 网 络 。 
(AF) 
[W1,B1, W2,B2,—, TE, TR] = TRAINBPX(W1,BI.F1,W2,B2,F2,-. P T. TP) 
输入 参数 : 
Wi WH i 层 的 权重 矩阵 
Bi 为 第 i RARER; 
字符 串 参 数 Fi 为 第 ; 层 的 转换 函数 ; 
P 为 包含 输入 矢 基 的 (RxQ) 阶 的 输入 矩阵 : 
工 为 包 侣 目标 矢量 的 (SxQ) 阶 的 目标 矩阵 ; 
TP AWRA (可 选择 ) 。 
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输出 参数 : 

Wi 为 新 权重 } 

вж; 

TE 为 实际 的 训练 数目 ; 

TR 为 训练 记录 (误差 )。 

可 供 选 择 的 训练 参数 : 

TP(1) 为 显示 之 间 的 训练 数目 , 预 置 值 为 25; 
TP(2) 为 训练 的 最 大 数 日 。 预 置 值 为 100; 

TP(3) 为 平方 误差 和 目标 , 预 置 值 为 0.02; 
TP(4) 为 字 习 率 (Learning rate) BUE (8290.01; 
TP(5) 为 学 习 率 增 量 , 预 置 值 为 1.05; 

TRO) WY EME, 预 置 值 为 0.7; 

TP(7) 为 惯量 常数 , 预 置 值 为 0. 9; 

TP(8) 为 最 大 误差 率 (Maximum error ratio), BRE RD 1. 04, 
没 给 训练 参数 的 都 将 采用 预 晋 值 , 

参见 NNTRAIN, BACKPROP, INITFF, SIMFF, TRAJNBP, TRAINLM. 
[EF] 


if all([5 6 89 1112] ~= nargin) ,errort Wrong number of input arguments’) end 


if nargin == 5 
a bed? = thpxl (i,j,k Лип): 
elseif nargin = = 6 


[a.b,c,d] = tbpx1G.j kl m.m: 


elseif nargin 一 一 


a,jb,c,d,e,fí] = tbpx2G.) kl m nio p; 


elseif nargin = 


а,Б,с.,е.0 = thpx2G.jek.l.m.n,o.psq); 


elseif nargin == 11 
gibie doeif,gih] = tbpxa(i, jk li mensospiqsres): 


elseif nargin == 12 


asbscodsesfgsh] = tbpx8G. jk ,lmnop stes Os 
end 
96. function [a,b,c,d,e.f,g,h.] = trainbpm lisj kl m.n,o,p.qor,s, 
函数 TRAINBPM Ж FH UE SE EL e BR E E ce LA B fe Pd T LLL TRS 
网 络 。 
【例子 】 
[W1,B1, W2,B2,",TE, TR} = TRAINBPM(W1,B1,F1,W2,B2 sF2,% P.T, TP) 
输入 参数 ， 
Wi 为 第 1 层 的 权重 矩阵 ; 
B 为 第 i 层 的 偏 置 列 矢量 ; 
字符 串 参 数 Fi 为 第 | 层 的 转换 函数 ， 
P 为 包含 输 人 矢量 的 (RxQ) 阶 的 输入 矩阵 ; 
工 为 包含 目标 矢量 的 (SNxQ ) 阶 的 目标 矩阵 + 
TP 为 训练 参数 〔 可 选择 ) 。 


输出 参数 ， 

Wi 为 新 权重 ; 

Bi 为 新 偏 置 ， 

TE 为 实际 的 训练 数目 

TR 为 训练 记录 (误差 ) 。 

可 供 选 择 的 训练 参数 : 

TP《1) 汐 显示 之 间 的 训练 数 日 , 预 置 值 为 255 
TP(2) 为 训练 的 最 大 数目 ， 预 置 值 为 1000， 

TPO APA REM Н M MEMA 0. 025 

TP (4) H% 3J E (Learning rate), MEAG. 01; 
TPGYN4 2) OB Ш. RIA 1.05; 

TP(6) ERR, 预 置 值 为 0.7; 

TPO) ARB, 预 置 值 为 0. 9; 

TPO ARARE Ж Maximum error ratio), HE fB 91.04. 
没 给 训练 参数 的 都 将 采用 预 置 值 ， 

参见 NNTRAIN. BACKPROP, [NITFF, SIMFF, TRAINBPX, TRAINLM. 
【程序 】 


if all([5 6 8 9 11 12] ~= nargin) ,error( Wrong number of input arguments’) ,end 


if nargin 5 
[a,b,c,d) = thpxl(i.j-k,l,m,[NaN NaN NaN NaN 1 1 NaN №): 
d= d(1.:); 


elseif nargin == 6 
n = [n NaN-+zeros(1,8) 11; 
fen = length(n)s 
n = n([: 2 3 4 len len 5 6) 
[a,b.c,d] = ркі, К.п): 
а= ds 


elseif nargin = = 8 
[arbeide f] = рх2 0, lam, n op, rs 
[NaN NaN NaN NaN 1 1 NaN NaN]); 
бела: 


elseif nargin == 9 
q = [q NaN+zeros(1,8) 1]; 
len = length(q): 
q = a([1 23 4 len len 5 6; 
[arbscsdres{] = rtbpx2G,j,k.1.m,n,o,p.q)i 
f= fy.) 


elseif margin = = 11 
[a,b,c,d,e,f,g,h] = tbpx3G.j,k.l.m.n.o,p.q r s, 
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[NaN NaN NaN NaN 1 1 NaN NaN]); 
h 2h; 


elseif nargin ~ ~ 12 
t = [t NaN- zeros (1,8) 1]; 
len = length(t); 
t = [123 4 len len 5 6D; 
Ca boe d.e f ghi = thpx3(i,j.kl.m,n,0,p.q.r.8.ty 
h = hO.0; 
end 
97. function [a,b,e,d,e,f,g.h] = trainlm(i, j. kl m, n.o piqo ross t 
函数 TRAINLM 采用 Levenberg-Marquardt FERM £i Bü б A. n] VL DI Ak R — Fa e ЯГА ЕР] 
三 层 网 络 。 
【例子 】 
[Wi.Bl.W2.B2.....TE,TR] = TRAINLM (W1.R1.F1 ,W2.B2.F2, .P, T. TP) 
输入 参数 ， 
Wi 为 第 i 层 的 权重 矩阵 ， 
Bi 为 第 1 层 的 偏 置 列 矢量 ; 
字符 串 参 数 Fi 为 第 1 层 的 转换 函数 ; 
PRLS A REA (RQ) BA ЖЕ: 
工 为 包含 目标 矢量 的 (SxQ Erf Н БЕРЕ, 
TP 为 训练 参数 〔 可 选择 )。 
输出 参数 ， 
Wi 为 新 权重 ; 
Bi 为 新 偏 置 ， 
TE 为 实际 的 训练 数目 ; 
TR 为 训练 记录 (误差 )。 
可 供 选择 的 训练 参数 : 
TP(1) 为 显示 之 间 的 训练 数目 , 预 置 值 为 25; 
TP(2) 为 训练 的 最 大 数目 , UE B 51000; 
TP(3) 为 平方 误差 和 目标 , 预 置 值 为 0. 02; 
TP(4)? 为 最 小 樟 度 ， 预 年 值 为 0. 0001; 
了 TP(5) 为 MU 的 初始 值 , 预 置 值 为 0. 001; 
TP(6) 为 MU ЖЖ. HBL 10; 
TP(7) 为 MU 减 量 的 乘 数 ， 预 秆 值 为 0. 1; 
TPA MU 的 最 大 值 , MERRI". 
没 给 训练 参数 的 都 将 采用 预 置 值 。 
参见 NNTRAIN, BACKPROP, INITFF. SIMEF, TRAINBP. TRAINBPX. 
【程序 】 
if all([5 6 8 9 11 12] ~= nargin) error Wrong number of input arguments’) send 
if nargin == 5 
ta,b,c,d] 


elseif nargin === 6 


tlmlG,jk,bm); 


[a,b,c,d] = tim1G,j,k.,l,m,n); 
elseif nargir. 8 
[a,b,c.d,e,f” = dm2i,joksleminsosp)s 
elseif nargir = 
{а›Ь,с,4,е = dm2G jk, msn ops 
elseif nargir. 11 
[a b.e die f gh] = timaG,j,k.l,ym,n,o, paq r.s); 


elseif nargin = = 12 
[a,b.c.d.e f, g,h] = tlm3Ci i k,l,m,n.o,p.g. rs. 
end 
98. function n = purelin(n.b) 
PAH PURELIN 为 线性 转换 或 称 活性 函数 
【例子 了 
(1) PURELIN (N) 
和 输入 参数 : N 为 包含 网 络 输 入 矢量 的 (SxQ) MER. 
应 用 实例 : n = 一 10: 0.1: 10; 
a = purelin (n); 
plot (n, a) 
(2) PURELIN (Z, В) 用 于 批 处 理 情况 。 
输 人 参数 ， 
Z 为 网 络 加 权 了 的 输入 矢量 的 〈SxQ) MER: 
BORRAR (Sxl) HRE. 
返回 值 为 网 络 矩 阵 中 在 一 1 至 1 之 间 的 数 。 
(3) PURELINC delta’ ) 返回 delta 函数 的 名 称 。 
PURELIN init) 返回 初始 函数 的 名 称 。 
PURELIN( name’) 返回 该 转换 或 活性 函数 的 全 名 。 
了 PURELIN (output) 返回 该 函数 值 的 输出 范围 。 
参见 NNTRANS, SATLIN, SATLINS. 
【程序 】 


if nargin < 1, error('Not enough arguments, ') » end 


if isstr(n) 

if stremp(lower(n) ,’delta’ ) 
n = 'deltalin' ; 

elseif strcmp (lower(n) ,'init' ) 
n = 'rends ; 

elseif strcmp(lower(n) name) 
п = ‘Linear’; 

elseif strcmp (lower (n) ,output' ) 
n = [—1e100 1e100]; 

else 
error (‘Unrecognized property. ') 

end 


else 
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af nargin 


[nr,ne] = size(n): 
n = n + b*ones(1,ne); 
end 
end 
99. function a = tansig(n,b) 
函数 TANSIG ЭЖЕ S 形 转换 或 称 活 性 西数 
【例子 】 
(1) TANSIG(N) 
BASEN 为 包含 网 络 输入 矢量 的 (SxQ) 阶 矩阵 。 该 函数 的 返回 值 为 矩阵 N 的 在 一 1 至 1 之 间 的 数 。 
应 用 实例 : а 一 —10,0 1,101 
а = tansig(n)s 
plot (n,a) 
(2) TANSJG(Z,B) 用 于 批 处 理 情况 。 
BAS. 
Z 为 网 络 加 权 了 的 输 人 矢量 的 CSxQ) 阶 矩阵 ; 
B 为 偏 置 失 量 的 CSx1) 列 矢量 。 
返回 值 为 网 络 矩阵 中 在 一 1 至 1 之 问 的 数 。 
(3) TANSIG( delta’) 返回 delta 函数 的 名 称 。 
ТАМОС ак) 返回 初始 函数 的 名 称 。 
TANSIGC'name') 返回 该 转换 或 活性 函数 的 全 名 。 
TANSIG (‘output’) 返回 该 函数 值 的 输出 范围 。 
参见 NNTRANS, BACKPROP, NWTAN, LOGSIG. 
【程序 】 


if nargin < 1, error(’Not enough arguments. '); end 


if isstr(n) 
if stremp (lower (n) ,'delta' ) 
a 一 “deltatan' ; 
elseif stremp (lower(n) ,init’) 
а = 'nwtan'; 
elseif stremp(lower(n),'name' ) 
а = ‘Hyperbolic Tangent Sigmoid' ; 
elseif stremp(lower(n) , output’ ) 
а= 1-11: 
else 
error Unrecognized property. ' ) 
end 
else 


2 


[агле] = size(n); 


if nargin = 


п = п + bxones(1,nO ; 
end 


a=2./ (i + exp(—2*n)) — l; 
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3 = find( finite(a))i 
aG) = sign GD); 
end 
100. function a = logsig(n,b) 
函数 LOGSIG 为 对 数 S 形 (sigmoid) 转 换 函 数 。 
[9171 
(1) LOGSIG (ND 
输入 参数 :N 为 包含 网 络 输 入 矢量 的 (SxQ) 阶 矩阵 , 12 BM IE AE N 的 在 0 至 1 之 间 的 数 ， 
应 用 实例 ; п = 一 10:0.1:10: 
а = logsig(n): 
plot(n,a) 
(2) LOGSIG (2,B) 用 于 批 处 理 情况 。 
влаж. 
Z 为 网 络 加 权 了 的 输 和 矢量 的 (SxQ) 阶 和 矩阵; 
BH fo HARE GS Sx DAK. 
3& [B ÉCOS PERSA БЕ tF EOE 12^ H I 8 , 
(3) LOGSIG (‘delta’) 返回 delta 函数 的 名 称 。 
LOGSIG ("init') 返回 初始 函数 的 名 称 。 
LOGSIG(name' ) 返回 该 转换 或 活性 函数 的 全 名 。 
LOGSIG('output') 返回 该 函数 值 的 输出 范 
参见 NNTRANS, BACKPROP, NWTAN, LOGSIG. 
【程序 


if nargin < 1, error( Note enough arguments. '); end 


if isstr(n) 

if stremp(lowerdn),’ delta ^ 
a = ‘deltalog’ ; 

elseif stromp(nwer(n),’ init ^) 
a = 'nwlog ; 

elseif stremp(lower(n) "пате ') 
a = 'Log Sigmoid' ; 

elseif stremp(ower(n),'output ') 
а = [01]: 

else 
error('Unrecognized property.  ) 

end 


else 


z 


[nr,nc] = size(n); 


if nargin: 


n = n t b# ones(1,nc); 
end 
a=1./ (1++ехр(—п)); 
i = fFind(-—finire(a)); 


ati) = sign(nG)) * 0.5 + 0.5; 
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end 
101. function d = deltalin(a,d ,w) 
函数 DELTALIN PURELIN M 70H Delta 函数 。 
【例子 了 
(1) DELATLIN(A) 
A 为 包含 输出 矢量 的 (SIxQ) 阶 矩阵 。 
该 函数 返回 包含 输出 矢量 通过 对 PURELIN 转换 函数 的 (S1xQ) 阶 FREE 
(2) DELTALIN(A,E) 
上 为 CS1xQ) 阶 误差 矩阵 。 
该 函数 返回 一 个 (S1xQ) 阶 的 输出 层 的 误差 导数 矩阵 
(3) DELTALIN(A,D,W) 
输入 参数 : 
D 为 (S2xQ) 阶 含 下 一 层 delta REKER, 
W 为 CS2xs1) 阶 的 层 间 的 权重 矩阵 。 
该 范 数 返回 -个 (SlxQ ) 阶 的 隐蔽 层 的 误差 导数 矩阵 ， 
参见 NNTRANS, BACKPROP, PURELIN. 
【程序 了 
if pargin == | 
d = ones (size(a)) ; 
elseif nargin = == 2 
d=d; 
else 
d= w' xdi 
end 
102. function d = deltatan(a,d,w) 
ЖК DELTATAN TANSIG 神经 元 的 Оена 函数 . 
【例子 】 
(1) DELTATAN(A) 
A 380333 ЖШ S1xQ) BME, 
RRR EIL TES CES CIA 
(2) DELTATAN(A,E) 
BASH. 
A 为 包含 输出 矢量 的 (SlxQ) 阶 矩阵 ; 
王 为 (S1xQ) 阶 误差 矩阵 。 
该 阔 数 返 回 -- 个 (SxQ) 阶 的 输出 层 的 误差 导数 矩阵 。 
(3) DELTATAN(A,D,W) 
输入 参数 : 
D 为 (S2xQ) 阶 售 下 一 基 delta 矢量 的 矩阵 } 
W 为 CS2xSI , 阶 的 层 同 的 权重 矩阵 。 
该 函数 返回 一 个 (S1xQ) 阶 的 隐蔽 层 的 误差 导数 拭 阵 。 
参见 NNTRANS, BACKPROP, TANSIG, DELTALOG, DELTALIN. 
【程序 】 


if nargin < 1,error('Not enough input arguments’) ,end 
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if nargin == 1 
d = 1—(a ка); 
elseif nargin === 2 
= (1—(а. жа)). «di 
else 


d = (1—(и. *а)). * (xd); 


end 
103. function d = deltalog(a,d,w) 
函数 DELTALOG LOGSIG 神经 元 的 Delta 函数 . 
【例子 】 
(1) DELTALOG(A) 
A 为 包 人 输出 矢量 的 (S1xQ) 阶 年 隆 。 
该 西数 返回 包含 输出 矢量 的 导数 矩阵 。 
(2) DELTALOG(A,E) 
BASH. 
ARE БЕЗ СЛС 
EX (51х0) SRE И, 
该 函数 返回 一 个 (SlxQ) 阶 的 输出 层 的 误差 导数 和 矩阵。 
(3) DELTATAN(A,D,W) 
输入 参数 ， 
О (52х09) А Е — 8 депа X ША; 
W 3(S2xS1)BL ЈЕ ТЕ ИО БОШ ЕРЕ. 
BBG Bl — (S1xQ) B EG RR TRS ЖОР РЕ. 
参见 NNTRANS, BACKPROP, LOGSIG, DELTALIN, DELTATAN 
【程序 】 


if nargin < }.еттог Not enough input arguments! },end 


if nargin = = 
d = а. ж (lads 
elseif nargin === 2 


d =a. *(1—а). *d; 
else 
=a. х (1—a). * (wi * d); 
end 
104. function [dw,db] = learnbp(p.d.l) 
函数 LEARNBP 为 误差 反 传 学 习 规 则 函数 。 


【例子 】 

{dW ,dB. = LEARNBP(P.D.LR) 
输入 参数 : 

P 为 (RxQ) 阶 输 人 矢量 矩阵 。 

EE 为 (SxQ) 阶 误差 矢量 年 阵 。 

LR 为 学 习 率 预 置 值 为 1)- 

输出 参数 : 


dW NS SUE НОЕ. 
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dB Jo iR EM B E. 
参见 NNLEARN, BACKPROP, SIMFF, INITFF, TRAINBP. 


【程序 】 


if nargin < 2, error Not enough arguments. '); end 


if nargin == 3, d = lr * d; end 


dw = dx p' 


if nargout = == 2 
[R,Q] = коеф): 
db = dx ones(Q.1); 

end 
105. function [dw,db] = learnbm(p,d,lr,me,dw.db) 
函数 LEARNBPM WS d PURI T- MRE REY MM BH. 
【例子 】 
[dW dB] = LEARNBM(P,D,LR,MC,dW,dB) 
BASE. 
了 ARQ) Bri A A BERE: 
D 为 (SxQ) BRR RR 
上 为 学 习 率 ; 
me AAR AF HR 
dW X (SxR) Bre НЕЕ: 
dB 为 (Sx1) 阶 偏 置 增 量 矢量 。 
输出 参数 ， 
dW ARR BMH: 
dB 为 新 偏 置 增 其 失重 . 
参见 NNLEARN. BACKPROP, SIMFF, INITEF, TRAINBPX. 
【程序 3 


if nargin < 5,error( Not enough input arguments’) end 


x = (—mo *lr* d; 
dw = me# dw + x*p'i 
if nargout = = 2 
[R,Q] = size(p)s 
db = me» db + x *ones(Q, D; 
end 
106. function j = learnlm (p, d) 
函数 LEARNLM Ж Levenberg-Marquardt 学 习 规 则 函数 。 
[5 71 
LEARNLM(P.D) 
PARQ ЛЖВ, 
D 为 (SxQ) 阶 误差 矢量 第 阵 。 
返回 ， 
偏 Jacobian 和 矩阵。 
参见 NNLEARN, BACKPROP, INITFF, SIMFF, TRAINLM. 


【程序 】 


if nargin < 2, error(’Wrong number of arguments. ') ,end 


[R,Q]=sze(p); 
[$,Q}=size ‘d); 
j= nncpy(d ,R) , * nncpyi(p',S); 

107. function m = errsurf(p ,t,wv,bv,f) 

ЖЖ ERRSURF 为 误差 表面 西数 . 

【例子 了 

(1) ERRSURF(P.T,WV,BV,F) 

PACxQ SAR EER: 

了 为 (lxQ) 阶 目标 矢量 矩阵 ， 

WV 为 权重 的 行 矢量 数值 ; 

BV 为 偏 置 的 行 矢量 数值 。 

字符 让 参数 :F 为 转换 或 活性 函数 。 

该 函数 返回 在 WV 和 BV 域 中 的 误差 值 。 

(2) 应 用 实例 :p 一 [一 6.0 —6.1 - 4.1 —4. 0 +4.0 +4.1 +6.0 +6,1J; 

t = [0.0 +0.0 十 .97 十 ,99 +,01 —,03 —1.0 1.01; 
l:l; bv = —25,25,2.5; 
ES = errsurf(p.t,wv bv, logsig’); 
plotes(wv ,bv,ES,[60 30]) 

参见 LINLAYER, BACKPROP, PLOTES, PLUTEP. 
[EF] 


if nargin < 5.error ("Not enough input arguments. ") rend 


m = zeros(length(bv) , length (wv) ; 
for Y=1 Лела У): 
m(Y,:) = nnsume((t’ x ones(1,length(wv))—feval(f,p' x we Fbv(Y))). ^ 2); 
end 
108. function plotes(wv,bv,es.v) 
函数 PLOTES Arie E RAE BK. 
【例子 了 
G) PLOTESCWV,BV,ES,V) 
WV 为 权重 的 行 矢量 数值 ; 
BV 为 偏重 的 行 矢量 数值 ， 
ES WV 和 BV 域 中 的 误差 值 ,由 ERRSURF 函数 算出 ， 
VARA: 预 量 值 为 [一 37. 5, 30]. 
(2) 应 用 实例 :p = [3 2]; 
t= [0.4 0, 8]; 
wv = —40.4idi bv = wv; 
ES = errsurf(p,t wv bv, logsig'); 
plotes(wv,bv,ES,[60 307) 
参见 LINNET, BACKPROP, PLOTEP, ERRSURF. 
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【程序 了 


if nargin < 3，error('Not enough input arguments’ ) end 


maxe = max(max(es)); 
mine = min(min(es)); 
drop = maxe--mines 
surfpos = mine — drop; 


contpos = mine — drop * 0. 95; 


newplot ; 


X LEFT 3—D PLOT 


subplot(1.2,1); 
[pxspy] = gradient(es,wv,bv); 
scolor = sqrt(px. ^ 2+py- ^ 2); 


% SURFACE 

sh = surf(wv ,bv,es-scolor); 

hold on 

sh = surf (wv, bv zeros length wv) length (bv)) +-surfpos ,scolor) ; 
set (sh ,’edgecolor’ ,[0.5 0.5 0.5D 


% ERROR GOAL 
ifo 
minw = min(wv); 
maxw = max(wv); 
minb = min(bv); 
maxb = max(bv); 
21 = plor3([minw maxw maxw minw minw ], = 
[minb minb maxb maxb minb],[0 0 0 0 0],’w'): 
22 = plot3([minw minw].[minb minb],[0 es(1.1)],’w')5 
23 = plot3([maxw maxw],[minb minb],[0 es(1 length (wv ))],'w!)s 
24 = plot3([maxw maxw],[maxb maxb],[0 esClength (bv) , length G2]. wD 5 
25 = plot3([minw minw ].[maxb maxb ],[0 esClength (bv) D] n 
set([z1 22 23 24 25), color ,[1 1 0D 


end 


M TITLES 

xlabel Weight Э; 

ylabel Bias B^); 

zlabel Sum Squared Error’) 
title (' Error Surface’) 


% WEIGHT & BIAS 
set ges lira! [nin (wy) max wv) J) 
set(gca ,'ylim' [min (bv) max (bv) 2) 


zlim = get(gca zm); 


И VIEW 


if nargin === 4, view(v) , end 


set (gea selim’ ,Lsurfpos maxe ]) ; 


subplot(1,2.2); 


% SURFACE 

sh = surf(wv,bv.es * 0,scolor); 
hold on 

set (sh ,"edgecolor’ ,[0.5 0.5 0.5]) 


% CONTOUR 

[cc sch] = contourCwv by es, 123; 
hold off 

set (ch ,‘edgecolor’ , [1 1 17) 


X TITLES 
xlabel(’ Weight W'); 
ylabelC Bias BY); 


title('Error Contour’ ) 


X VIEW 
view([0 90]) 
set(gea,’xlim’ ,[min (wv) max (wv) D 


set(gca,"ylim' [min (bv) max (bv) J) 


% COLOR 


colormap (cool) ; 


109. function hh = plotep(w,b,e,h) 
ФАЙ PLOTEP 为 权重 和 偏 置 在 误差 表面 位 置 作 图 函数 。 


【例子 】 

(D Н = PLOTEPLW,B,E) 
LATI 

W 为 当前 权重 值 ; 

B 为 当前 偏 置 值 ; 
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上 为 当前 误差 。 

和 输出 参数 :H 为 下 一 次 调用 函数 所 需 信 息 。 

(2) PLOTEP(W,B,E,H》 用 于 继续 调用 
输 和 参数:H 为 前 一 次 调用 函数 PLOTEP 所 得 信息 。 
输出 参数 :H 为 下 一 次 调用 函数 所 需 信息 。 

参见 LINNET, BACKPROP, ERRSURF, PLOTES 
【程序 】 


if nargin < 3, error (Not enough input arguments ) end 


И GET LAST POSITION 


if nargin = 
wich. 
b2 = h(2); 
delete(h (3:lengrh(h))); 


end 


% MOVE MARKERS 
и 
hold on 

subplot(1,2,12:; 


zlim 


get (gea, zlim’); 

up = —zlimQ2 * 0.05: 

plot3(w,b,zlim(1)+up,’. w’ ,'erasemode' ， none' ) 

h2 = plot3([w w]*fb b],[e alim(1)]+ap,’. w ,'markersize’ ,20); 


subplot(1 2,2); 


hl = plot(w,b,'. w' , markersize' , 20); 


% CONNECT NEW POSITION 


if nargin == 4 
subplot (1,251) 
plot3(Ew2 w],[b2 b],[0 07-- zlimCD ар, , linewidth’ ,2) 


subplot (1,2,2) 
plot ([w w2],[b b2].'b/ ,"linewidth' 2); 


end 


hold off 


drawnow 


if nargout === 1 
bh = [ws ə; hl; h255 
end 


110. function [wl,bl,iytr] = thpl(w1,bl.fl.p.t.tp.wv-bv,es.v! 
BR TBP1 用 于 训练 一 层 前 传 误差 反 传 网 络 。 
【例子 】 

(W.B,TE.TR] = TBP1CW,B,F,P,T.TP) 
BASÉ. 

WA GxROBEBURTSRE: 

BOX (SDH 8716 0; 

FARSER F 为 PRUE BM: 

了 为 包含 输入 矢量 的 (RxQ) 阶 的 输 人 矩阵; 

T 为 包含 目 标 矢 量 的 (SxQ) 阶 的 目标 矩阵 。 

TP 为 训练 参数 可 选择 ). 

输出 参数 ， 

W 为 新 权重 ; 

BARRE: 

ТЕ 为 实 乐 的 训练 数目 ; 

TR 为 训练 记录 (误差 )。 

可 殿 选 择 的 训练 参数 : 
TP《1) 为 显示 之 间 的 训练 数目 . 预 置 值 为 25， 
ТРО) SRN BARA, HEA 为 1000; 
TP(3) 为 平方 误差 和 目标 , 预 置信 为 0. 02， 
TP(4) 为 学 习 率 (Learning rate), HAO. 01. 
没 给 训练 参数 的 都 将 采用 预 置 值 。 

参见 NNTRAIN, BACKPROP, INITFF. SIMFF, TRAINBP, TRAINLM. 
【程序 】 


if nargin < 5 error Not enough arguments. ’),end 


% TRAINING PARAMETERS 


if nargin == 5, tp = []; end 

tp = nndef(tp,[25 1000 0. 02 0.01; 
df = tpCD: 

me = tp( 25 

eg = tp(32; 

Ir = tp(4): 


dfl = feval(I1, delta"); 


% PRESENTATION PHASE 
al = feval(fl,wl * p,b1): 
e= tal; 

SSE = sumsqr(e) : 


% TRAINING RECORD 
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tr = zeros(1,me+1); 
tr(1) = SSE; 


% PLOTTING FLAG 

[req] = size(o); 

[s.q] = size(:); 

plottype = (margin >— 8) + (Guax(ris) == 1); 


X PLOTTING. 
newplot; 
message = sprintf(/ TRAINRP: % %g/%6g epochs, SSE = Ир. \n' me): 
fprintf (message .0,SSE) 
if plottype =-= 1 
h = plotfa(p,t.p.al)s 
elseif plottype == 2 
if nargin < = 8, es = errsurf(p,t wv rbv f15 end 
if nargin <= 9, v = [—37.5 30]; end 
plotes(wv,bv,es,v); 


h = plotep(w1,b1,SSE); 


= 
| 


= ploterr ‘tr(1) eg); 


% TRALNING 


for i=1:me 


% CHECK PHASE 
if SSE < eg, i = i — l; break, end 


% BACKPROPAGATION PHASE 
dl = feval(dfl,a1,e); 


% LEARNING PHASE 
[dwl,db1] = learnbp(p,d1,l : 
wl = wl + dwl; bl = bl + dbi, 


% PRESENTATION PHASE 
al = feval(f1,w1 * p,b1); 

e = t—al; 

SSE = sumsqr(e); 


% TRAINING RECORD 
trG+1) = SSE; 
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И PLOTTING 
if remG.df) = = 
fprintf (message i SSE) 
if plottype = = 1 
delete th); 
h = plot(p.aD: 


elseif plouype == 2 
h = plotep(w1,b1,SSE,h); 
else 
h = ploterr(tr(1; (+1)) eg eh) s 
end 
end 


% TRAINING RECORD 
T= ts 


% PLOTTING 
if rem G df) ~= 0 
fprintf (message ,i,SSE) 
if plottype = = 
delete); 
plot(p,a1); 
elsesf plottype = = 2 
plotep(w1.b1,SSE,h); 
else 
ploterr (tr eg sh) : 
end 


end 


М WARNINGS 
if SSE > eg 
disp(' э 
disp TRAINBP; Network error did not reach the error goal. э 
disp(! Further training may be necessary, or try different?) 
disp( inital weights and biases. ') 
disp 9 
end 
111. function [w1,b1,w2,b2,i,tr]=tbp2(w1,b1,f1,w2,b2,f2,pst,tp) 
函数 TBP2 用 于 训练 二 层 前 传 误差 反 传 网 络 。 
CAF] 
[W1, Bl, W2, B2. TE, TR] = TBP2 (W1, Bl. Fl, W2, B2, F2, P, T, TP) 
输入 参数 ， 
Wi thi BORSA: 
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Bi 为 第 1 屋 的 的 偏 置 列 矢 量 ， 

字符 串 参 数 Fi 为 第 i 层 的 转换 函数 ， 

P 为 包含 输入 矢量 的 (RxQ) MBAR; 
TMS HEASEE (S2xQ) 阶 的 目标 和 矩阵; 
TP 为 训练 参数 “可 选择 )， 

输出 参数 ， 

Wi 为 新 权重 ; 

Bi AFMR: 

TE 为 实际 的 训练 数目 ， 

TR 为 训练 记录 (误差 ) 。 

可 供 选 择 的 训练 参数 : 

TP(1) 为 显示 之 间 的 训练 数目 ， 预 置 值 为 25; 
TP(2) 为 训练 的 最 大 数目 , MEH 1000; 
TP(3) 为 平方 误差 和 目标 。 预 笑 值 为 0. 02; 
TP(4) 为 学 习 率 (Learning rate), ДП {& 50.01, 
ЗШЕ раа, 

[851 


if nargin = = В. error Not enough arguments.) . end 


% TRAINING PARAMETERS 


if nargin == 7. tp = [03 end 

tp = nndef(tp. 125 1000 0.02 0.012; 
dí = tp CD; 

me = tp (2); 

eg = tp (3); 

lr = mp (4); 


dfi = feval(fi.‘delta’); 
df2 = feval(f2.'delta') ; 


И PRESENTATION PHASE 
al = feval(fl, wl*p. bl); 
a2 = leval(f2. w2* al, b2); 
e = t-a2; 


SSE = sumsqr e); 


% PLOTTING FLAG 

[r. q = size(p); 

[s2, qJ = size(t); 

plottype = тпах(г, 52) == 1; 


% TRAINING RECORD 
tr = zeros(1, me); 
tr(1) = SSE; 


% PLOTTING 
newplot ; 
message = sprintf(/TRAINBP, % %g/%g epochs, SSE 
fprintf(message, 0, SSE) 
if plottype 
h = plotfa(p, t, p. a2); 
else 
h = ploterz(tr CD. eg); 


end 


for i=]; me 


М CHECK PHASE 
if SSE < eg, i—i— 1; break, end 


% BACKPROPAGATION PHASE 
42 = fevaldf2, a2, e); 
dl = fevaltdfl, al, d2, w2); 


% LEARNING PHASE 
[dwl, dbi] = learnbp(p. dl, lr); 
[dw2, db2] = learnbp(al, 42, lr); 
wi = wl — dwl; bl = bi + dbl; 
w2 = w2 — dw2; b2 = b2 + db’ 


% PRESENTATION PHASE 
al = feval(fl, wl*p, bt); 
a2 = feval(f2, w2*al, b2); 
e = 1—а2; 

SSE = sumsqr (e); 


% TRAINING RECORD 
trG+1) = SSE; 


X PLOTTING 


ifrem(i, df) = 


0 
fprintf (message, i, SSE) 
if plottype 
delete(h); 
h = plot(p, a2); 
drawnow; 
else 
h = pleterr(tr (1, 0110), eg, h); 


end 


= Hg me); 
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end 


end 


% TRAINING RECORD 
tr = trl: G4 D», 


У PLOTTING 
if rem(i, df) ~= 0 
fprintf (message, i, SSE) 
if plottype 
delete(h)s 
plot(p, a2); 
drawnow. 
else 
ploterr(tr, eg, h); 
end 


end 


X WARNINCS 
if SSE > eg 
disp") 
disp TRAINBP; Network error did not reach the error goal. ‘> 
disp’ Further training may be necessary, or try different) 
disp іміз] weights and biases and/or more hidden neurons. ') 
disp( — 5D 
end 
112. function [w1,bl.w2,b2,w3,b3.i,tr] = thp3(w1 bl £1,w2.b2,f2,w3. b3. f3, p.t. 
tp) 
BR TBP3 用 于 训练 3 层 前 传 误差 反 传 网 络 
【例子 
[W1,B1,W2,B2,W3,B3,TE.TRJ := TBP3(W1,B1.F1.W2.b2.F2.W3,.B3,F3,P,T,TP) 
输 人 参数 : 
Wi 为 第 i1 层 的 (SixR) 阶 的 权重 矩阵 ; 
Bi 为 第 i 层 的 (Six1) 阶 的 偏 置 列 矢 量 ; 
FH BBW Fi Ж ARR, 
P 为 包含 答 和 人 矢量 的 (RxQ) 阶 的 输 和 矩阵; 
本 为 包含 目标 矢量 的 (S2xQ) 阶 的 目标 矩阵 ; 
TP 为 训练 参数 可 选择 )。 
输出 参数 ， 
Wi 为 新 权重 ， 
Bi AR a Es 
ТЕ 为 实际 的 训练 数目 ， 
TR 为 训练 记录 (误差 ) 。 
可 供 选 择 的 训练 参数 : 


681 


TPQ) 为 显示 之 间 的 训练 数 目 , 预 置 值 为 25; 
TP(2) 为 训练 的 最 大 数 自 , 预 置 值 为 1000; 
TP(3) 为 平方 误差 和 目标 , 预 置信 为 9. 02; 
TP(4) 为 学 习 率 (Learning rate)， 预 置 值 为 0. 01。 
没 给 训练 参数 的 都 将 采用 预 置 值 。 
【程序 】 

if nargin < 11,error( Not enough arguments. '),end 

% TRAINING PARAMETERS 

if nargin 11. tp = []: end 

tp = andef(:p,[25 1000 0.02 0.01]; 


df = tp; 
me = tp(2) 
eg = tp(3)s 
b= (4); 


dfl = feval(fL,'delta' 2; 
df2 = feval(f2,’delta’); 
df3 = feval(f3,’delta’)s 


и PRESENTATION PHASE 

al = feval(fl,wl * p.b1); 

a2 = feval(f2,w2 * al,b2); 

аз = feval(f3,w3 * a2,b3); 

e=t—a3; i 
SSE = sumsgr (e); 

tr = zeros(1,me) ; 


tr(1) — SSE; 


% PLOTTING FLAG 
[а] = size(p); 
[s3,q] = szelt); 


plottype = max(r,s3) == l; 


% PLOTTING 
newplot 
message = sprintf{(’TRAINBP: %%4g./%g epochs, SSE = 96 Hg. \n’ sme) + 
fprintf (message 0 SSE) 
if plottype 
h = plotfatpstspsa32 i 
else 
h = ploterr(trCD eg) : 


end 


for i=1:me 
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% CHECK PHASE 
if SSE < eg, 1=1—1; break, end 


% BACKPROPAGATION PHASE 
d3 = feval(df3.a3.e)5 

d2 = feval(dí2,a2,d3.w32: 

di = feval(dfl,al.d2,w2); 


% LEARNING PHASE 

[dw1,db1] := learnbp(p,d1.lr); 
[dw2,db2] = learnbp(al,d2,1r); 
[dw3,db3] = learnbp(a2.d3,1r); 
wl = wl — dwl; bl = bl + dbl; 
w2 = w2 ~ dw2; b2 = b2 + db2; 
w3 = w3 — dwi; bà = b3 + db3; 


x 


PRESENTATION PHASE 
al = feval(fl,wl*p.bl); 
a2 feval(f2,w2 * al. b25; 


a3 = feval({3,w3 * a2,b3); 


е = 1—43; 


SSE = sumsqr(e); 


% TRAINING RECORD 
trG 十 1) = SSE; 


и PLOTTING 
if remG.df) == 0 
fprintf (message ,i, SSE) 
if plottype 
delete(h); 
h = plot(p,a2); 


drawnow; 
else 
h = ploterr(tr(1: G+ 1)),eg,h); 
end 
end 
end 


и TRAINING RECORD 
tr = Uu GEDD,; 


% PLOTTING 
if rem(i,df) ~= 0 
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fprinti (message „i, SSE) 
if plottype 
delete(h); 
plot(p.22); 
drawnow; 
else 
ploterr(tr.eg sh): 
end 


end 


% WARNINGS 
if SSE > eg 
disp '› 
dispC TRAINBP: Network error did not reach the error goal. ') 
disp Further training may be necessary, or try different ) 
disp! initial weights and biases and/or more hidden neurons.) 
disp‘) 
end 
113. function [wl,bl,ivtr] = tbpxl (wl,bl,fi,p,t,tp) 
MM TBPX1 用 十 训练 一 层 网 络 的 快速 误差 反 传 方法 
【例子 了 
[W.B.TE,TR] = TBPX1(W.B.F.P,T,TP) 
WAS: 
W 为 CSxR) 阶 权重 矩阵 ， 
В 为 (Sx1) 阶 的 偏 置 列 矢量 ; 
字符 审 参 数 F 为 转换 (或 活性 ?函数 ， 
P 为 包含 输入 矢量 的 (RxQ) 阶 的 输入 短 阵 ， 
TT 为 包含 昌 标 矢量 的 (SxQ) 阶 的 目标 甜 阵 。 
TP 为 训练 参数 (可 选择 ). 
输出 参数 : 
Wi 为 新 权重 ， 
Bi 为 新 偏 置 ; 
TE 为 实际 的 训练 数目 ; 
TR 为 洲 练 记录 (误差 )。 
可 供 选择 的 训练 参数 : 
了 PH) 为 显示 之 癌 的 训练 数目 , 预 置 值 为 25， 
了 P(2) 为 训练 的 最 大 数目 , 预 置 值 为 1000; 
TP(3) 为 平方 误差 和 目标 , 巴 置 值 为 0.02; 
TP(4) 为 学 习 率 (Learning rate). HHL HO. 01: 
TP(5) 为 学 习 率 增 量 , BUR ROS 1.05; 
TPO) WE BBR. MEX 0.7: 
TP(7)%9 Momentum constant, 预 置 值 为 0. 9; 
TP(8)35 RARER (Maximum error ratio), BUR (EAT. 04. 
没 给 训练 参数 的 都 将 采用 预 置 值 , 


684 


[EF] 


if nargin < 5,error( Not enough arguments. ') end. 


% TRAINING PARAMETERS 


if nargin == 5, tp = []; end 

їр = andef(tp,[25 1000 0.02 0-01 1.08 0.7 0.9 1,04])， 
df = tp(1); 

me = 1р(2); 

eg = tp(3); 

h = tp(4); 

im = tp(5); 

dm = tp(6); 

me = 1р(7); 

er = tp(B); 


dfl = feval(f1,‘delta’); 


dwl wl*0, 
dbl = bl*0; 
MC = 0; 


% PRESENTATION PHASE 
feval(f1,wl* p,b1); 


t-al; 
SSE = sumsqr'e); 


% TRATNING RECORD 
tr = zeros(2,me+1); 
tr(1:2,1) = [SSE; Ir]; 


% PLOTTING FLAG 
[rq] = size(p); 
[51.4] = size); 


plottype = (max(r,s1) 


X PLOTTING 
newplot; 
message = sprintf(/TRAINBPX: %% 9@/%g epochs, Ir = %% g, SSE = И g. W mei 
fprintf (message -0,lr, SSE) 
if ploteype 
h = plotfa(p.t.p.al); 
else 
h = plottr(tr(1;251) seg); 


end 


% BACKPROPAGATION PHASE 
dl = feval(dil ,al se); 


for :一 1:me 


34 CHECK PHASE 
if SSE < eg, i—i—1; break. end 


% LEARNING PHASE 
[dwi .dbli = learnbpm (p d1,lr MC .dw1,db1); 
MC — me: 


new wl = wl + dwl; new bl = bl + dbl; 


% PRESENTATION PHASE 
new _al = feval(fl,new _wl*psnew БТ): 
new e = t—new _als 


new _ SSE == sumsgr(new €): 


% MOMENTUM & ADAPTIVE LEARNING RATE PHASE 
if new _ SSE > SSE x er 
lr = I+ dms 
C-6 
else 
if new _ SSE < SSE 
ly = des im; 
end 
wl = new wl; bl = new _bl; al = new al; 


е = new e; SSE = new _ SSE; 


% BACKPROPAGATION PHASE 
dI = feval(dfl.al.e); 


end 


X TRAINING RECORD 
пб +1) = (SSE; br] 


% PLOTTING 
if rem(i d) == 0 
fprintf (message ilr. SSE) 
if plottype 
delete(h) ; 
h = plot(p,al); 
else 


h = alottr(tr(1:2,1: GT DOsegibD s 
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end 
end 


end 


1⁄4 TRAINING RECORD 
tr = tr(1:2,1:G+1)); 


% PLOTTING 
if гет, ~ = 0 
fprintf message i slr, SSE) 
if plottype 
delete(h). 
plorCp,al); 
else 
ploter(tr sgh) s 
end 


end 


% WARNINGS 
if SSE > eg 
dsp "> 
disp TRAINBPX; Network error did not reach the error goal. ' ) 
disp Further training may be necessary, or try different ) 
disp( initial weights and biases and/or more layers.) 
disp И 
end 
114. function [wi,bl,w2,b2,i,tr] = thpx2(w1,bl.fl,w2,b2,f2.pst,tp) 
WAR TBPX2 用 于 训练 二 层 网 络 的 快速 误差 反 传 方法 . 
IHF] 
% [W1,B1,W2,B2,TE,TR] = TBPX2(W2,B2,F1,W1,B1,F2,P,T,TP) 
输 人 参数 ， 
Wi 为 第 1 层 权重 矩阵 ， 
Bi A38 i ЖЕЛКЕ, 
字符 申 参 数 Fi WHR REE) BH, 
PARMA RRA (RQ) BO ЛЕВЕ: 
T 为 包含 目标 矢量 的 (SxQ) 阶 的 目标 短 阵 ; 
TP 为 训练 参数 可 选择 )。 
输出 参数 ， 
Wi 为 新 权重 
Bi 为 新 偏 置 ， 
TE 为 实际 的 训练 数目 3 
TR 为 训练 记录 (误差 )。 
可 供 选 择 的 训练 参数 : 
TP (1) 为 显示 之 间 的 训练 数目 , 预 置 值 为 25; 
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TP(2) 为 训练 的 最 大 数目 , 预 置 值 为 1000; 

TP(3) 为 平方 误差 和 目标 , 预 置 值 为 0.02; 
TP{4) 为 学 习 率 (Learning rate), 预 置 值 为 0. 01; 
TP(5) 为 学 习 宰 增 重 , 预 置 值 为 1. 05; 

ТРО) УЖИ, 预 置 值 为 0.7; 

TP(7) 为 Momentum constant, MEA 0.9; 

TP(8) 为 最 大 误差 率 (Maximurn error ratio), 预 置 什 为 1- 04。 
没 给 训练 参数 的 都 将 采用 预 置信 。 

【程序 】 


if nargin < 8,error (Not enough arguments. ') ;end 


1⁄4 TRAINING PARAMETERS 


if nargin = = 8. tp = []; end 

tp = nndef(tp,[25 1000 0. 02 0.01 1.05 0.7 0. 9 1.04]); 
df = tp): 

me = tp(2); 

eg = tp(3); 

Ir = 1р0); 

im = 1р(5); 

dm = tp(6); 

me = tp(7); 

er = tp(8); 


dfl = feval(f1,’delta’); 
df2 = feval({2,’delta’) + 


dwl = w1* O; 


dbl = bi* 0; 
dw? = wZ*0, 
db2 = b2 * 0; 


MC = 0; 


% PRESENTATION PHASE 
al = feval(fl.wi x p,bl); 
a2 = feval {2.w2 x al,b2); 

e = t—a2; 


SSE = sumsar(e); 


% TRAINING RECORD 
tr = zeros(2,me+ 1); 
tr(1:2,1) = [SSE; Ir]; 


% PLOTTING FLAG 
[rq] = size(p); 
{s.q] = sizes 
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plottype = (axis) 


% PLOTTING 
newplot; 
message = sprintf’ TRAINBPX: % %g/%g epochs. lr — g, SSE = ИИ. \n' sme); 
fprintf (message ,0,lr, SSE) 
if plottype 
= plotfa(p,t,p.a2): 

else 

h = plottr(tr (1; 2,1) eg); 
end 


% BACKPROPAGATION PHASE 
d2 = feval(df2.a2.e); 
dl = fíeval(df1,a1,d2,w2); 


for i=1:me 


% CHECK PHASE 
if SSE < eg, i—i— 15 break, end 


% LEARNING PHASE 

[dw1.db1] = learnbpm (p+dl,lr, MC .dw1 .db1) ; 
{dw2,db2] = learnbpm(al ,d2.Ir.MC,dw2.db2)+ 
MC = mes 

new wl = wl + dwl; new bl = bl + dbl; 

new _ w2 = w2 + dw2r new _b2 = b2 十 db2s 


И PRESENTATION PHASE 

new al = fevaldl,new wl*p,new _b1); 

new a2 = feval(f2,new wl*new _al,new _ b2); 
new e = vnow айз 


new _ SSE = sumsqr(new e); 


% MOMENTUM & ADAPTIVE LEARNING RATE PHASE 
if new _ SSE > SSE ¥ er 


lr = |г* dm; 
MC = 0; 
else 


if new _ SSE < SSE 


Ir = |г* im; 


end 
wl = new wl; bl = new _bl; al = new al; 
w = new _w2; b2 = new b2:a2 = new _a2; 


е = new е, SSE = new _ SSE; 


% BACKPROPAGATION PHASE 
d2 = feval(dí2 22,6) 
dl — feval(df1,a1,d2,w2); 

end 

У TRAINING RECORD 

абяз = [SSE; tr]; 

X PLOTTING 

if rem G,df) = 
fprintf (message siylr SSE) 


0 


if plottype 
deleteth) ; 
h = plot(p.aZ); 


drawnow 
else 
h = plottr(tr(1;2.1:€+1)).eg sh); 
end 
end 
end 


И TRAINING RECORD 
tr = rZ h GHD; 
X PLOTTING 
if rem(i,df) ~~ = 0 
fprintf (message «i,lr, SSE) 
if plottype 
delete(h) 4 
plot (р,а?); 
drawnow 
else 
plottr(treeg sh); 
end 
end 
и WARNINGS 
if SSE > eg 
disp( э 
disp TRAINBPX ; Network error did not reach the error goal. ') 
disp( Further training may be necessary, or try different’) 
disp( initial weights and biases and/or more hidden neurons. ' ) 
disp g 


end 
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115. function [w1,b1,w2,b2,w3,b3.itr]=tbpx3(w1,b1,f1,w2,b2 (2,w3,b3,f3,p at tp) 


BK TBPX3 用 于 训练 二 层 网 络 的 快速 误差 反 传 方法 。 
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【例子 了 

[W1,B1,W2,B2, W3,B3, TE,TR] = TBPX3(W1,B2,F1,W1,B1,F2,W3,B3,F3,P,T TP) 
输入 参数 ， 

Wi 为 第 i 层 权重 矩阵 ; 

BAR ЕЖЕ; 

字符 串 参 数 Fi 为 转换 (或 活性 ) 函 数 ， 

РЫЯ A ЖЕ (RQ) BPA AJER 

T 为 包含 目标 矢量 的 (SxQ) 阶 的 目标 矩阵 ， 

TP 为 训练 参数 〈 可 选择 > 。 

输出 参数 ; 

Wi 为 新 权重 ， 

Bi 为 新 偏 置 ; 

TE 为 实际 的 训练 数目 ， 

TR 为 训练 记录 (误差 ) . 

可 供 选择 的 训练 参数 ， 
TP(1) 为 显示 之 间 的 训练 数目 , 巴 置 值 为 25; 
TP(2) 为 训练 的 最 大 数目 ， 预 置 值 为 1000; 
TP(3) 为 平方 误差 和 目标 , 预 置 值 为 0. 02; 
TP(4) 为 学 习 率 (Learning rate), f 88290. 01; 
TRAST RWS, MEA 1.05; 
TP(6) 为 学 习 率 减 量 , WH 0.7; 

TP(7) 为 Momentum constant, 预 置 值 为 0. 9; 
TP(8) 为 最 大 误差 率 (Maximum error ratio), SES 8 91.04, 
没 给 训练 参数 的 都 将 采用 预 置 值 。 

DERI 


if nargin < 11.error( Not enough arguments. ') send 


У TRAINING PARAMETERS 


if nargin == 11, tp = []; end 

tp = nndef(tp,[25 1000 0. 02 0.01 1.05 0.7 0.9 1.04D; 
df = 1р(1); 

me = tp(2); 

eg = tp(3); 

lr = tp(4); 

im = tp(5); 

dm = tp(6); 

me = tp(7); 

er = tp( 821 


dfl = feval(f1,'delta^); 
dí2 = feval(f2,'delta'); 
df3 = feval(£3,'delta') 


dwl = w1 #0; 
db] = b) *0: 


691 


dw2 = w2* 0; 
db2 = b2* 9; 
dw3 = м3 + 0; 
db3 = b3*0; 
MC = 0; 


М PRESENTATION PHASE 
al = feval(11owl * pbl); 

ай = fevald2sw2x al b2); 
a3 = feval(13,w3 * a2,b3); 
e = t—a3; 


SSE = sumsgr(e; 


1⁄4 TRAINING RECORD 
tr = zeros(Z,me+1); 
tr(1:2*1) = (SSE, Ir]; 


И PLOTTING FLAG 

[req] = size(p); 

[sq] = size(t); 

plottype = (max(r,s) == 1) & 0; 


% PLOTTING 

newplots 

message = sprint |TRAINBPX: % %g/%g epochs, lr = 068, SSE = % Mig. NY оте) з 
fprintf Cmessage ,0 ,lr, SSE) 


if plottype 

h = ploda(pit,pia3): 
else 

h = plottr(i 1:2. D seg? s 
end 


% BACKPROPAGATION PHASE 
d3 = feval(di3,a3,8); 

42 = feval(di2,a2,d3,w3)s 

dl = feval(dfl,a1,d2,w2); 


1 


for i=1:me 


% CHECK PHASE 
if SSE < eg, i=i—1; break, end 


% LEARNING PHASE 
[dw1,db1] = learnbpm(p,d1,Iir,MC,dw1,db1); 
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[dw2,db2] = learnbpm(a1,d2,1r,MC,dw2,4b2); 
[dw3,db3] = learnbpm (a2 ,d3 ,lr.MC,dw3,db3); 
MC = mc; 

new wl = wl + dwl; new _b1 = bl + dbl; 
new _w2 = w2 — dw2; new _b2 — b2 + db2; 


new w3 = w3 + dw3; new ЪЗ = З — db3; 


У PRESENTATION PHASE 

new al ~ feval(flynew_ wl*p,new b]; 

new а? = feval(f2,new _w2* new _ alsnew _ b2); 
new a3 = fevalCf3,new _w3*new _a2.new _b3); 


new е = 


-new a3; 


new _ SSE ~- sumsqr(new _ e); 


Ж MOMENTUM & ADAPTIVE LEARNING RATE PHASE 
ifnew _ SSE > SSE жег 


lr = lr* im; 
MC = 0; 
else 


if new _ SSE < SSE 

lr = r+ im; 

end 
wl = new wli bl = new_bl; al = new ali 
w2 — new _w2; bó = new _b2; a2 一 new a2; 
w3 = new _w3; b3 = new _b3; a3 = new аз: 


e = new е: SSE = new _ SSE; 


% BACKPROPAGATION PHASE 
d3 = {ема (df3.a3,e); 

d2 = fevai(df2,a2,d3,w3); 

dl = fevai(df1,a1,d2,w2): 


end 


% TRAINING RECORD 
tr(1:2,i+1) = [SSE; Ir]; 


% PLOTTING 
if rem (i.d == 0 
fprintf (message si Ir, SSE) 
if plottype 
delete(h 1; 
h = plottp;a32i 
else 


h 


ploter(tr(1:2,1:G+1)),eg.h); 


end 
end 


end 


% TRAINING RECORD 
tr = trl:2,1;G+)D); 


и PLOTTING 
if remG, db) ~~ = 0 
fprintf (message 1 Ir. SSE) 
if plottype 
delete(h); 
plot(p.at 
else 
plottr(tr-eg sh) + 
end 


end 


X WARNINGS 
if SSE > eg 
dise — OD 
disp TRAINBPX : Network error did not reach the error goal. ' ) 
disp( Further training may be necessary» or try different’) 
disp( iniual weights and biases and ‘or more hidden neurons. ') 
disp) 
end 
116. function [w1,b1,i,tr] = tlm1(w1,b1,f1,p.t ,tp) 
函数 TLM1 训练 一 层 前 传 误差 反 传 网 络 的 Levenberg-Marquardt 方法 . 
[571 
[W,B.TE,TR] = TLM1(V.B,'FI',P,T) 
输入 参数 ; 
W 为 权重 矩阵 ， 
BARRA RBs 
iB tt F 为 转换 函数 ， 
P 为 包含 输入 矢量 的 (RxQ) 阶 的 输入 短 阵 ; 
THAE Bir RERO CSIXQ ) 阶 的 目标 矩阵 
TP 为 训练 参数 〈 可 选择 ) 。 
输出 参数 ， 
Wi 为 新 权重 ; 
Bi WE: 
TE 为 实际 的 训练 数目 ， 
TR 为 训练 记录 (误差 )。 
可 惧 选 择 的 训练 参数 : 
TP(1) 为 显示 之 间 的 训练 数目 , 预 置 值 为 25; 
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TP(2) 为 训练 的 最 大 数 旭 , WA 301000; 
TP(3) 为 平方 误差 和 目标 , 预 置 值 为 0. 02; 
TP(4) 为 最 小 梯度 ， 预 慎 值 为 0, 0001; 
TP(5) 为 MU 的 初始 值 ， 预 置 值 为 0. 001; 
TP(6) 为 MU 增 基 的 乘 数 ， 预 置 值 为 10; 
TP(7) 为 MU MEHRA, MEN 0-1; 
TP(8) 为 MU HR KIA, 1851", 

没 给 训练 参数 的 都 将 采用 预 冒 值 。 
【程序 】 


if nargin < 5,error( Not enough arguments. ) ,end 


% TRAININC PARAMETERS 


if nargin == 5, tp = [Js end 

tp = nndef(tp,£25 1000 0. 02 0.0001 0. 001 10 0.1 1е10]); 
df = tp(1); 

me = tp(2)+ 

eg = tp(3); 


grad _ min = рО); 
mu init = 1р(5); 
mu inc = tp 6); 
mu dee = tp(7)s 
mu max = tp(8); 


dfl = feval(f1,‘delta’); 


% DEFINE SIZES 

[sl,r] = sizetwl); 

wl ind = [1:(s1 * 0]; 

bl ind = [11] + wl ind(ength(wl ind); 
ii = eyeCbl, indlength(bl ind))); 

dwl = wl; dbl = bli 


ext p = nnepyi(p.sl); 


% PRESENTATION PHASE 
al = simuff(p,w1,bl,fD; 


e= tal; 


SSE = sumsqr(e) i 


% TRAINING RECORD 
tr = zeros(l .met 1); 
tr(1) = SSE; 


% PLOTTING FLAG 
plottype = (r==1) & (s1==1); 


% PLOTTING 
newplot | 
message = sprintf("TRAINLM: % %g/%g epochs, mu = 7% %gy SSE = 35g. n sme) з 
fprintf (message 0»mu _ init, SSE) 
if plottype 
h = plotfa(p,t,p,a1); 
else 


h = plorerr(tr(1),eg); 


end 
mu = mu mit; 
for i=1:me 


% CHECK PHASE 
if SSE < eg, i—i—1; break, end 


% FIND JACOBIAN 
dl = feval(dfl ,al); 
ext di = —nncpyd(d1); 
jl = leamlm(ext _psext _д1); 
j= 01, ext _4 з 


% CHECK MAGNITUDE OF GRADIENT 
Je 一 j* eG); 


grad = norm(je); 


if grad < grad min, 3; break, end 
34 INNER LOOP, INCREASE MU UNTIL THE ERRORS ARE REDUCED 
Hayes 


while (mu <= mu , max) 
dx = —(ji+ii* mu) \ jes 
dw1G) = dxGw1_ind)s dbl = dx(bl, ind); 
new wl = wl + dwl: new bl = bi + dbl; 


% EVALUATE NEW NETWORK 
al = simuff(psnew _wl new blfD; 
new _e = t—ali 


new. SSE = sumsqr(new _e); 


if (new _ SSE < SSE), break, end 
mu = mu* mu_incy 
end 


if (mu >> mu max), i = 1—1; break, end 


mu = mu* mu des 


% UPDATE NETWORK 
wl = new wl; bl = new bl: 


e = new e; SSE = new _ SSE; 


X TRAINING RECORD 
wG+1) = SSE; 


X PLOTTING 
if rem(i,df) == 0 
fprintf (message ,i,mu,SSE) 
if plottype 
delete(h); h = plet(p;al;'m; drawnow; 
else 
h = pleterr(tr(1: Gd: 122 ,eg,b); 
end 
end 
end 


34 TRAINING RECORD 
= r: GHID; 


% PLOTTING 
if rem(i,di) ~= 0 
fprintf (message i mu, SSE) 
if plottype 
delete (h) s 
plot(p,al m); 
drawnow; 
else 
ploterr(tr,eg sh); 
end 


end 


Ж WARNINGS 
if SSE > eg 
disp '› 
if (mu > mn _ max) 
disp TRAINLM: Error gradient is too small to continue learning. `) 
else 
disp" TRAINLM: Network error did not reach the error goal.’ 
end 


disp(* Further training may be necessary, or try different‘) 


disp initial weights and biases and/or more hidden layers. °) 


disp(’ э 


епі 


117. function [w1,b1,w2,b2,i,tr] = thn2(w1,bl.fl,w2,b2,f2.p,t,tp) 


函数 TLM2 采用 Levenberg-Marquardt 方法 ,用 于 训练 一 层 前 传 误差 反 传 网 络 。 
【例子 】 

[W1.B1,W2.B2, TE, TR] = TLM2(W1,.BI.'F1', W2,B2.'F2'.P.T) 
BASH 

Wi Hi BREER, 

Bi AP BARENE: 

字符 申 参 数 Fi 为 转换 (或 活性 ) 函 数 ; 

了 为 包 侣 输入 矢量 的 (RxQ) 阶 的 输入 矩阵 ; 
了 为 包含 目标 矢量 的 (S2xQ) 阶 的 目标 矩阵 ; 
TP 为 训练 参数 OAH). 

输出 参数 : 

Wi 为 新 权重 

Bi 为 新 偏 置 ， 

TE 为 实际 的 训练 数目 ; 

TR 为 训练 记录 (误差 >。 

可 供 选 择 的 训练 参数 ， 
TP(1) 为 显示 之 间 的 训练 数目 , 预 置 值 为 25; 
TP(2) S VIMAR А, f W 71000: 
TP(3) 为 平方 误差 和 目标 , 预 置信 为 0. 02， 
TP(4) 为 最 小 梯度 ， 预 置 什 为 1“} 
TP(5) 为 MU 的 初始 值 , 预 置 值 为 0. 001; 
TP(6): MU HEM, BR 10; 
TP(7) 为 MU REFER, 预 置 值 为 0. 1; 
TP(8) 为 MU 的 最 大 值 , BUR (DSTI. 

没 给 训练 参数 的 都 将 采用 预 置 值 

DES 


if nargin < &verror( Not enough arguments. ') „епі 


% TRAINING PARAMETERS 
if nargin == 8, tp = []; end 
tp = nndef(tp,[25 1000 0. 02 le 一 6 0.001 10 0.1 Iel0 


df = 1р0), 

me = tp(2); 

eg = GN 

grad min = tp(4)s 

mu init = tp(5)5 

mu imc = tpl); 

mu dec = tp(7); 

mu max == tp( 55; 

dfl = feval(fl, дека’) 
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df2 = feval({2,’delta'); 


% DEFINE SIZES 

[sl,r = size(w1); 

[s2,s1] = sizetw2); 

wl ind = [1:(si*1)]; 

bl ind = [1;s1” + wi_ind(length(wt_ind)); 

w2 ind = [1:51 #520) + bl ind(length(bl ind); 
Ъ2 ind = [1.52] + w2_ind(length(w2_ind)); 
eye(b2_ind(length(b2_ind)))s 

dwl = wl; dbl = bl; 

dw2 = w2; А2 = b2; 


ext. p = nncpyi(p,s2)+ 


% PRESENTATION PHASE 
[al,a2] = simuff(p.w1,bl.f1,w2,b2,f2); 
e = t—a2z; 


SSE = sumsqr"e); 


% TRAINING RECORD 
tr = zeros(1.me+ 1) 


tr(1) = SSE; 


% PLOTTING FLAG 
plottype = (т===12 & G2==D; 


% PLOTTING 
newplot 5 
message == sprintf TRAINLM: % 06/68 epochs. mu = И Vig. SSE = И Ид Ni me); 
fprintf (message ,0,mu | init, SSE) 
if plottype 
h = plotfa(p,t.p.a2); 
else 
h = ploterr(tr(1) eg); 


end 


mu = mu ini: 


for i= lime 
% CHECK PHASE 
if SSE < eg, i—i— 1; break, end 


% FIND JACOBIAN 


ext al = nnepyi(al,s2)s 


42 = fevalidf2,a2); 

ext _42 = —nnepyd(d2); 

ext di = feval(dfl,ext_al,ext_dZ,w2)s 
‚ jl = learnlm(ext _pvext di^ 

j = learnlm(ext _al,ext _ d2); 


j= [ily ext_dt j2, ext 0075; 


% CHECK MAGNITUDE OF GRADIENT 


je =j * еб); 


grad = norm(je); 


if grad < grad _ min, i=i— 1; break, end 


% INNER LOOP, INCREASE MU UNTIL THE ERRORS ARE REDUCED 


j-i*h 


while (mu <= mu max) 
dx = —Gi-ü* mu) \ jes 
dwl(:) = dx(wl ind; db 
dw2(:) = dxCw2 inj; db 


3; EVALUATE NEW NETWORK 
Га1,а2 


new _е = ads 


new _ SSE = sumsqr(new 6). 


if (new _ SSE < SSE), break, end 
mu = mu * mu inc; 

end 

if (mu > ma, max), i = i—1; break, end 


mu = mu * mu dec; 


% UPDATE NETWORK 

wl = new wl; bl = new bl; 
w2 = new wl b2 = new _b2s 
e = new е; SSE = new _ SSE; 


% TRAINING RECORD 
trG+1) = SSE; 


% PLOTTING 
if remG,df) == 0 
{printf (message imu SSE) 


dx(b] ind); 
= áx(b2 іад); 
new wl: wl + dwl; new bl = bl + dbl; 
new _w2 = w2 + dw; new _b2 = b2 + db2; 


simuff(p,new wl,new bl.fl,new _w2,new _b2.f2); 
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if plottype 
delete(h); h = plot(p.a2, m '); drawnow: 
else 
h = ploterr(tr(1; Gi+1)),eg-h); 
end 
end 


end 


% TRAINING RECORD 
tr = tr(1:G+1)); 


% PLOTTING 
if rem(i,df) 一 
fprintf message i mu SSE) 


0 


if plottype 
delete(h) i 
plt(p.a2. m ^0; 
drawnow; 

else 
ploterr(tr-egsh); 

end 

end 


% WARNINGS 
if SSE > eg 
dip — D 
if (mu > mu max) 
disp TRAINLM: Error gradient is тоо small to continue learning. ' Y 
else 
disp TRAINLM: Network error did not reach the error goal. `) 
end 
disp( Further training may be necessary, or try different") 
disp( initial weights and biases and/or more hidden neurons. ') 
dip 9) 
end 
118. function [w1,b1 ,w2,b2,w3,b3,i,tr] = tlm3 Qw1.b1,£1,w2,b2 2 rw3 ,ЬЗ f3.p.t,tp) 
HM TLM3 采用 Levenberg-Marquardt 方法 ,用 于 训练 三 层 前 向 误差 反 传 网 络 . 
【例子 】 
[W1,B1,W2,B2,W3.B3,TE,TR] = TLM3CW1,B1,F1,.W2,B2,F2,W3,B3,F3,P,T) 
BASH. 
Wi 为 第 1 层 权重 矩阵 ; 
Bi 为 第 i 层 偏 置 列 矢量 ; 
FARER Fi 为 转换 (或 活性 ?函数 ， 
P 为 包含 输入 矢量 的 (RxQ) 阶 的 输入 和 矩阵; 


TRASH RBH (Сохо ВЕЕ; 
TP 为 训练 参数 可 选择 )。 

输出 参数 ， 

Wi 为 新 权重 ; 

Bi 为 新 偏 置 ; 

TE 为 实际 的 训练 数目 ; 

TR 为 训练 记录 (误差 )。 

可 供 选择 的 训练 参数 ， 
TP(1) 为 显示 之 间 的 训练 数目 . 预 置 值 为 25; 
TP(2) 为 训练 的 最 大 数目 , 预 置 值 为 1000; 
TP(3) 为 平方 误差 和 目标 , 预 置 值 为 0. 02; 
TP(4) 为 最 小 梯度 , 预 置 值 为 0. 0001， 
TP(5) 为 MU 的 初始 值 , 预 置 值 为 0. 001; 
TP(6) 为 МОЖЕ, 预 置 值 为 10; 
TPCA МОМЕ, 预 置 值 为 0.1: 
TP(8) 为 MU 的 最 大 值 , BUB DS T. 

没 给 训练 参数 的 都 将 采用 预 置 值 。 

【程序 】 


if nargin < .lyerror( Not enough arguments. ') end 


1⁄4 TRAINING PARAMETERS 
if nargin = = 11, tp = []; end 


tp = nndef(tp.[25 1000 0. 02 0.0001 0. 001 10 0.1 1e10]); 


df = 100): 
me = 1р(2); 
eg = 1р(3); 


grad min = tp(4)s 
mu init = tp(5); 

mu inc = 1р(6), 

mu dec = tp(7)5 

mu max = tp(8); 

ағ = feval'f1.‘delta’); 
df2 = feval'f2;'delta 2; 
df3 = feval<{3,’delta'); 


% DEFINE SIZES 
[str] = size(wD s 
[82,з11 
[33,52] 
wi ind = [1:G1« 0]; 

bl ind = [1,51] + wl_ind(length(w1_ind)); 

w2 ind = [1.(в1*52)] + bl ind(ength(bl ind); 
s2] + w2_indQength(w2_ind)); 
7:682 * s3)] + b2_ind(length(b2_ind)); 


size(w2); 


size(w3); 
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b3 ind = [1.93] + w2_ind(length(w3_ind)); 
ii = eye(b3 ind(ength(b3 ind); 

dw] = wl: dbl — bi; 

dw2 = w2; db2 = b2; 

dw3 = w3: db3 = b3; 

ext p = nncpyi(p,s3); 


% PRESENTATION PHASE 
[el,a2,a3] = simuff(p,w1,b1,f1.w2,b2,f2,w3,b3,13); 
е = tad; 

SSE = sumsqr(e); 


% TRAINING RECORD 
tr = zeros(1,re+1); 
tr(1) = SSE; 


% PLOTTING FLAG 
plottype = (2221) & (s2- = 1); 


% PLOTTING 
newplots 
message 一 sprinti C TRAINLM; % %g/%g epochs» mu = % Pig, SSE = МИ Vig. \а' mei 
ÍprintíGanessage,0,mu _ init, SSE) 
if plottype 
h = plotfa(p,t,p.a3)y 
else 
h = ploterr(tr(1) eg); 
end 
mu = mu init: 


for i=1:me 


X CHECK PHASE 
if SSE < eg, i—i— 1; break, end 


% FIND JACOBIAN 
ext al = nncpyi(al,s3); 
ext _a2 = nncpyi(a2553); 
d3 = feval(d£3,a3); 
ext _43 = —nnepyd (d3); 
ext _42 = feval(df2,ext _a2sext_d3.w3); 
ext dl = feval(dfl,ext al,ext _d2, w2); 
jl = learnlm(ext _psext_d1)s 
j2 = learnlm(ext _al,ext _ d2); 


j3 = learnlm(ext _a2,ext_d3); 


j = Cil, ext _dl', j2, ext 427, j3, ext 430: 


% CHECK MAGNITUDE OF GRADIENT 
je= y ж еб), 
grad = norm(je); 


if grad < grad. min, i—i— 13 break, end 


% INNER LOOP, INCREASE MU UNTIL THE ERRORS ARE REDUCED 


Haven 


while Gnu <= mu _ max) 


dx = —-(jj+ii ж mu) \ јез 


dw](:) = dx(wl, ind); dbl = dx(bl ind); 
dw2(.) = dx(w2_ind); db2 = dx(b2 inj); 
dw3(;) = dx(w3 ind); db3 = dx(b3 ind); 


new wl = wl + dwl; new bl = bl + dbl; 
new _w2 = w2 + dw2; new _b2 = bz + db2; 
new wi = w3 + dw3; new ЪЗ = b3 + db3; 


3€ EVALUATE NEW NETWORK 
[а1,а2.а3] =-= 


simufí(p.new wl.new blflanew _w2,new _b2.f2,new w3,new _ b3,f3); 
new e = t—a3; 


new SSE = sumsqr(new e): 


if (new _ SSE < SSE), break, end 
mu = mu * mu inc: 
end 
1: break, end 


mu = mu * mu dec; 


if (mu > та тах), i 


М UPDATE NETWORK 

wl = new wl; bl = new bl; 
w2 = new _w2; b2 = new _ b2; 
w3 = new _w3; b3 = new b3, 


e = new e; SSE = new SSE; 


% TRAINING RECORD 
па+1) = SSE; 


% PLOTTING 
if rem(i,df) == 0 


{printf message i, mu, SSE) 
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if plottype 
delete(h): h = plot(p.a2.'m'); dtawnow; 
else 
= ploterr (tr(1: +12) seg h); 
end 
end 


end 


% TRAINING RECORD 
t Suq G+); 


% PLOTTING 
if remG,dD ~= 0 
fprinti (message ,i,mu,SSE) 
if plottype 
delete(h); 
plot(psa2, m^): 
drawnow; 
else 
ploterr Cr segsh) à 
end 


end 


% WARNINGS 
if SSE > eg 
disp( 9 
if (mu > mu max) 
disp TRAINLM: Error gradient is too small to continue learning. `) 
else 
disp TRAINLM, Network error did not reach the error goal. ') 
end 
disp( Further training may be necessary, or try different’) 
disp(' initial weights and biases and/or more hidden neurons. ^) 
disp( 5 
end 
119. function Imsobj=Imsobj(c. х,у); 
函数 lmsob 为 最 小 方差 中 位 数目 标 函 数 子 程序 ,为 函数 snopi WASTES, 
[9/71 
Imsobi=Imsobj(c,x,y); 
输入 参数 :c 为 浓度 矢量 ; 
x ARE 
y 为 响应 矢量 ; 
输出 参数 ,Imsobj 所 得 目标 函数 值 . 


【程序 】 


error=x *c-- yg 


Imsobj—median&error. x error); 


第 十 五 章 MATLAB 原 程序 变量 说 明 与 使 用 示例 


一 、MATLAB 中 最 优化 计算 工具 箱 (optimization toolbox) 使 用 示例 


1. 考虑 以 下 函数 的 无 约束 优化 《〈 极 小 值 ) 问题 
{Cx) = exp(x(1)). Gx CD 2x(2)2 十 4x(1).x(2) 十 2x(2) + 1) 

D ж ЯН 

у fun = 'exp(x(1)) * (he x(1) 2 十 2xx(2) 2+ 4e xCO *xCD + 2*х(2) 十 1) 
(2) 给 出 初始 搜寻 点 

у x0 =[-11] 
@ 用 预 置 的 参数 值 

? options = [ J 
(4) 采用 函数 fminu 对 此 问题 进行 优化 

> [xs options] = fminu(fun, x0, options); 
O 其 最 优 坐 标 位 置 为 


) x 


0. 5000 — 1. 0000 
(6) 其 最 优 解 为 
) options(8) 
ans = 
1. 3029e— 010 
(7) 该 优化 过 程 对 其 进行 计算 的 总 次 数 为 
) options(10) 
ans = 
2， 考 虑 以 下 函数 的 有 约束 优化 GMD 问题 
minimize f(x) 一 exp(x(1)) „Сак CLD 2x(2)2+ 4x(1).<(2) 十 2x(2) + 1) 
HRR: 1.5 + 0). х0) — x(1) — x(2)<= 0 
—x(1).x(2) <= 10 
D 定义 目标 函数 和 约 菏 条件 
Мы = '{ = ехр(х(1)) x (twx(1) 2 十 2#x(2) 2 + dex) «xD + 2«x(D А Dr: 
Mung = 'g = [1.5 + x(1) x x(2) — к) — x(2); —х(1) «x(D — 103; 
Жап = [funf fung]; 
о) 给 出 初始 搜寻 点 
} хо = [-11J; 
@) 用 预 置 的 参数 值 
) options = []; 
(4) 采用 函数 constr 对 此 问题 进行 优化 


)[x, options] 一 constr(fun, x0, options); 


GO 其 最 优 坐 标 位 置 为 


x 


—9.5474 1.0474 
(6) 其 最 优 解 为 
1 options(8) 
ans 一 
0.0236 
C) 其 解 的 约束 条 件 为 


tg = [L5 + x(1) *x(2) — x€D — xi — x(1) > x(2) — 10] 


g= 
1.0e—015 * 

— 0. 8882 

) 


(8) 该 优化 过 程 对 其 进行 计算 的 总 次 数 为 


) options(10) 
ans = 


29 


3. BRUT ESSE A RAR I4 〈 极 小 值 ) 问题 
minimize f(x) = exP(x(1)) . (4x (1)?+ 2x(2)2T 4x(1).x(2) + 2x(2) — 1) 
1,5 + x1). (2) — x€D — xQ) <= 0 
= x(D.x (2) <= 10 


约束 条 件 : 


U) 定义 目标 函数 和 约束 条 件 
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> funf = "Е = exp(x(1)) ж (4*x(D^ 2 + 2" x(2)7 2 + 4+*#х(1) *x(2 + Z=x(2) + D); 


) feng = 'g = [1.5 + x(1) ж x(2) — x(1) — x(D; —x(1) *x(2 — 10]; 


) fun = [funf fung]; 
D 给 出 初始 搜寻 点 

> x0 = 1-11}: 
(3) Ris esi 

> options = [ J; 


(4) 用 函数 constr 来 进行 优化 计算 


》[x，options] = constr(fun, х0, options, vlb, vub); 


在 此 输 人 参数 vlb 和 vub 为 
У МЬ = zeros(1,2); 

) vub = [ J, 
O 其 最 优 坐 标 位 置 为 


dx 


O 1.5000 
(6) R mites 
? options(8) 


ans = 


AH TRX-0 
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8. 5000 
D 其 解 的 约束 条 件 为 
) g = [1.5 — x(1) *x(2) — x(1) — x(2): — x) *x(9) — 107 


g= 
0 
— 10 
(D 该 优化 过 程 对 其 进行 计算 的 总 次 数 为 
У optiens(10) 
ans = 


10 
4 如 果 由 使 用 者 提供 导 函 数 ， 可 加 快运 算 ， 仍 考虑 以 下 函数 的 有 约束 的 优化 问题 
minimize f(x) = exp(x(1)) . GIx OD! + 2х(2)#— 4x(1).xt2) + 2x(2) £D 
ARR: 1.5 + x(1).x(2) — x() xG)« 0 
хе). x(2) <= 10 
D 定义 目标 函数 和 约束 条 件 
)fanf = Ч = exp(x(1))* 04 *х(1)72—?+#х(@ 2 H ax ж х0) + 2* xD Es 
) jung = 'g — [1.5 — xCO #x(2) — xQ) (295 一 xl)xx(2) — 10]; 
) un = [funf fung]; 
D 给 出 初始 搜寻 点 
У х0 = [~1 1]; 
(3) 用 预 置 的 参数 值 
У options = [+ 
(4) EL BRA RR B SP R BE PE 
) dfdxl = ‘exp(x(1)) * (d xx(1) 2+2 #x(2) 2—49 (1) * x€D $24 x(2)4:1) 4 ж exp(x(1)) * (2 * x 
MED: 
) dfdx2 = '4xexp(x(1))* (OD xD +0. 5);'; 
у dídg = '[x(2)— 1, 2x; x(D—1, —х(1)13'% 
) grad = |'dt—(' dfdx1, dfdx2,']; dg. в]: 
(5) ЖЖ constr 来 进行 优化 计算 : 
) [x, options] = сопвт биз» x0, options, [ J, [ 7, grad); 
(6) 其 最 优 坐标 位 置 为 
x 


x 
—9. 5474 1.0474 
《7) 其 最 优 解 为 
) options(8) 
ans = 
0. 0236 
(8) 其 解 的 约束 条 件 为 
) g = [1.5 + xG) *x(2) — x(D — x(2); — xG) *x(2) — 101 
g= 
1.0e—014 + 
9.1110 
— 0.1776 


(9) 该 优化 过 程 对 其 进行 计算 的 总 次 数 为 
У options(101 
ans = 
11 
5， 由 使 用 者 纵 出 不 同 的 选择 ， 可 改变 优化 过 程 的 最 终 条 件 和 呈 示 模式 ， 人 考虑 以 下 函数 的 无 约 更 的 优 
化 问题 : 
оо = apa) .(4х(107— 2x0 4x00 xQ) + 2x(2) r D 
(1) EX Rin 3k 
у fun — 'exp(x(1)) x ax) 2 十 2xx(02 2 1 1ях(1)*х(2) + 24 x2) — D 
(2) 给 出 初始 搜寻 点 
хо -= [=l 12; 
(3) 重新 给 出 终止 标准 
У options(2) = le- 8; % ен ЕЕ: 
) options(3 = le 一 8; 06 ВИА AE IE RI 
(4) 用 函数 imin 来 进行 优化 计算 
Тж, opuons] = fminu(fun, x0, opnons) 


CO 其 最 优 航标 位 置 为 


dx 
x= 
0. 5000 - 1. 0000 
(6) 其 最 优 解 为 
) options(8) 
ans = 
3. 4412е— 014 
CD. 该 优化 过 程 对 其 进行 计算 的 总 次 数 为 
У options(10) 
ans = 
61 
(D 如 果 想 看 到 该 优化 过 程 的 送 代 情 况 ， 则 可 令 
) options (1)= 1; % 即 表示 将 选择 项 中 的 第 一 项 改 为 1。 [DELI ITI ER: 
(9) 用 函数 fminu 来 进行 寻 优 计算 


у Tx. options] = fminufun, x0, options) ; 


ELI 
-COUNT FUNCTION STEP-SIZE GRAD/SD 
+ 1.8394 1 —0.677 
9 1.72427 0. 361834 — 0. 00354 
17 0.362233 5.90886 一 0. 295 
20 0.221775 3 0. 436 
25 0.0171251 0. 529597 0. 00204 
30 6. 31008e— 005 0. 25069 — 2, 92е — 005 
36 6. 21504e— 008 1.37782 1, 27 — 009 


Optimization Terminated Successfully 
NUMBER OF FUNCTION EVALUATIONS=36 
6， 用 优化 程序 来 进行 曲线 拟 合 示例 
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D 先 给 出 一 个 数据 例 于 
) Data = 
[ 0.0000 2.8955 
0. 1000 3. 5639 


0.2000 2. 5173 
0.3000 — 1.9790 
0. 4000 1. 8990 
0.5000 1.3938 
0. 6000 1.1359 
0. 7000 1.0096 
0.8000 1. 0343 
0. 9000 0. 8135 
1. 0000 0. 6856 
1.1000 0. 6100 
1. 2000 0. 5592 
1.3000 0. 3646 
1.4000 0.3608 
1. 5000 0. 5474 
1.6000 0, 3459 
1.7000 0.1370 
1. 8000 0. 2211 


1. 9000 0.1794 
2.0000 0.2636]: 

D 将 此 数据 在 屏 莫 上 显示 出 来 
> t = Data(:,1); 
> y = Data(,,2); 
» axis([0 2 —0.5 6]) 
> figure (fig) 
) hold on 
) plot (t.y,'ro’ ,' EraseMode' none"); 
> titleC Input data’ ) 

(3) 用 MATLAB МЖА — MRIS кж 
function f = fitfun (lam,Data,Plothandle) 
% FITFUN (lam,Data,Plothandle) returns the error 
Ví between the data and the values computed by the current 
% function of lam, FITFUN assumes a function of the form 
Wo y cO # exp(—lam(1) xt) 一 … + ci ж exp(—lam(n) x t) 
% with n linear parameters and n nonlinear parameters; 
t= DataG;,1); y = Data(s 42); 
А = zeros length (t) Јела аш); 
for j = 1:sizeQlam) 

АС.) = exp(—lam(j) x0; 

end 


c = AW: 
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z= А+с; 

Í = 2-у; 

% Statements to plot progress of fitting: 
set (Plothandle ,' ydata' ,z) 


drawnow 


将 该 函数 以 M 文件 形式 保存 下 来 。 
(4) 给 出 该 函数 的 初始 值 及 原 图 的 句柄 
) lam = [1 901: 
) h = plot(t,y, b-' ' EraseMode' ，xor 5 
CO 调用 优化 程序 来 进行 曲线 拟 合 
在 marlab 的 优化 工具 箱 中 。 可 采用 下 述 方法 来 进行 优化 ， 
1) Broyden-Fletcher-Golfarb-Shanno 
2) Davidon-Fletcher-Powell 
3) Steepest Descent 
4) Simplex Search 
5) Gauss-Newton 
6) Levenberg-Marquardr 
如 采用 方法 D 来 进行 上 述 数 据 拟 合 ; 则 有 ; 
>OPTIONS=0; 
>[lam,OPTIONSJ=fminu (norm (fitfun2(x,P1+P2))' lam ,OPTIONS,[].Datash)s 
如 采用 方法 2) 来 进行 上 述 数 据 拟 合 , 则 有 : 
>OPTIONS(6) =1; 
>[lam,OPTIONS]=fminv (norm fitfun2 (x P1, P2)» lam „OPTIONS, [T Data 5 
如 采用 方法 3) 来 进行 上 述 数据 拟 合 , 则 有 : 
>OPTIONS(6)=2; 
>[lam,OPTIONS]=fminy C norm(fufun2(x,P1,P2)) lam „OPTIONS, [7,Datash)s 
如 采用 方法 4) 来 进行 上 述 数 据 拟 合 , 则 有 ， 
TOPTIONSG2—1: 
> Пат, OPTIONS] fmins( norm (fitfun2 (x ,P1.P2))' lam, OPTIONS, [],Datz.sh)s 
如 采用 方法 5) 来 进行 上 述 数据 拟 合 , 则 有 : 
>OPTIONS(5)=1; 
>[lam ,OPTIONS]=eastsq( fitfun2” , lam,OPTIONS,[ J,Data,h) + 
如 果 用 方法 CORBET LS MA: 
>OPTIONS= 0; 
> [lam OPTIONS ]=leastsq (‘fitfun2" , lam OPTIONS, [ ];Data.h) + 


=, MATLAB 中 最 优化 计算 工具 箱 通用 选择 参数 〈options》 WA 


最 优化 计算 工具 箱 通用 选择 参数 (OPTIONS) 可 用 于 很 多 MATLAB 子 程序 ， 如 ， 
在 MATLAB 自身 中 的 : FMIN 酉 数 和 FMINS 函数 ， 以 及 在 其 最 优化 计算 工具 箱 中 的 下 列 函 数 中 : 
ЕМШИ, CONSTR, ATTGOAL， MINIMAX, LEASTSQ, FSOLVE. 
RES IA: 
default _options=[0,1e—4.1e — 4.1e—6,0,0.0,0,0,0,0,0,0,0,0, 1e— 8.0. 1,0]; 
这 些 参 数 的 意义 如 下 ， 
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OPTIONSQ) 一 显示 参数 (HBO. "EI 时 ,将 显示 其 些 结果 ; 
DRTIONS(2) — 坐标 位 置 ( X УЖЕ CER. те 4); 

OPTIONSCO- — B Es BRA НЕ CEL: Le D; 

OPTIONS(4) 一 -约束 系 件 违背 终止 标准 ( 预 置 值 为 :16 -6)， 

OPTIONSG) 一 算法 迁 择 参数 , 当 其 为 1 时 ,表示 选择 FMINS SEEK LEASTSQ 函数 ， 
OPTIONS) 一 算法 选择 参数 ; 
当 其 为 06 时 ,表示 选择 FMINU 函数 中 的 Broyden-Fleccher-Golfarb —Shanno 算法 ; 
当 其 为 1 时 ,表示 选择 FMINU 函数 中 的 Davidon-Fletcher-Powell 算法 ， 

当 其 为 2 时 ,表示 选择 FMINU 丽 数 中 的 Steepest Descent 算法 ， 

OPTIONS(7)— 一 算法 选择 参数， - 维 搜索 算法 (Line Search Algorithm). Сі 0) 


OPTIONS(8)— 3& Fl REED s 


OPTIONS(9)— 如 想 检查 用 户 提供 的 梯度 值 时 ,可 将 其 设置 为 LARRY 0); 


OPTIONS (1)) 一 返回 该 优化 过 程 进 


生计 算 的 总 次 数 ; 


OPTIONS(11) 一 返回 该 优化 过 程 对 函数 梯度 进行 计算 次 数 ; 
DPTIONS(12) 一 返回 该 估 化 过 程 对 约束 条件 进 行 计算 次 数 ， 
OPTIONS(1:3 一 返回 该 优化 过 程 对 等 式 约束 进行 计算 次 数 ; 
OPTIONS(14) 一 WAS CE TI HADR AKKER 100 乘 以 变量 数 )， 
OPTIONSG5? 一 -只 用 于 最 优 控 制 的 日 标 达到 (goal attainment) 过程， 


OPTIONSGO 一 只 用 于 有 限 差分 梯度 过 程 ; 


OPTIONS(17)- 一 只 用 于 有 限 差分 梯度 过 程 (intte difference gradients) ; 
OPTIONS(18)- 一 步 长 (ШИН 1 或 更 小 值 )。 


三 、 模 糊 K- 均 值 聚 类 方法 应 用 示例 


Hiris 一 
2. 3000 3. 2000 4. 3000 5. 
2. 4000 3.3000 4. 6000 5. 
2.7000 2.9000 4, 6000 5. 
2.7000 3. 2000 4. 0000 5. 
2.1000 3. 6000 47000 5 
3.1000 2.1000 5. 8000 4, 
3. 2000 2. 5000 5. 3000 4. 
3. 7000 2. 4000 5.6000 3. 
3. 2000 2.7000 5.9000 4 
3.5000 2. 8000 5.1000 3. 
41000 2. 8000 2.1000 2 
4. 2000 2.«000 2. 7000 2. 
4. 7000 2.1000 3. 6000 3. 
3. 9000 3. 6000 2. 9000 3. 
4. 5000 2. 7600 2. 8000 3. 

class] = iris(findGris(;,5)==1), ; 

Z= class2 = iris(find Giris(; ,5) = —2), 


2»class8 = 


>data = iris; 


data moss size(data , 1); 


Dexpo = 2.0; 


iris (ш Giris(: ,5)= —3), 


6000 
1000 
8000 
9000 
2000 
3000 
00060 
90CD 
1050 
7000 
8000 
0000 
1009 
2009 


2 
DE 


3, 


0000 
0000 


1 
1 
1.0000 
1.0000 
1.0000 
2. 0000 
2. 0000 
2 
2 
2 
à 
3 
3. 
3, 


0000 


. 0000 
. 0000 
. 0000 
. 0000 
. 0000 
. 0000 


0000]; 


% data for class 1 
Ж data for class 2 


% data for class 3 


% whole data set to be clustered 


% number of data 


Җ Exponent for U 
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cluster nm - 3; 2% Number of clusters 
>max Мег = 100; У Max. iteration 

>min_ impro = le—6; 0 Min. improvement 

obj fcn = zeros(max iter. D) — Array for objective function 
>digitH = zerosicluster n. 6); У Array for handles of cluster centers” 
AU ~ initicm(cluster_n, data m); % Initial fuzzy partition 


>[U, center] = stepfem(data, U, cluster. п, expo); % Initial cluster centers 
>mark — '. : % Project data to 2—D and plot them 


>seq = [1 2; 135 146 2 35 2 4 3 4]; 

>for] = 1:6, 

> x= ose, 1); y = зең}, 2); % inputs selected for plot 
> subplot(2,3,)); 

> h = pletelassl 6i ,x) class2(:,x) class3(; 307, + 

> [class1(;,y) class2(;,y) elass3(:.y)1, mark): 

> set(h, ‘markersize’, 8); 

>  xlabelc["x' int2str(x)J); ylabel( "x° int2str(y)1) 
fork = 1:cluster n. % Initialize centers 

> digitH (kj) = text(center(k, seqG 1D 

> center(k.seq(j,2)), int2str(k)) : 

> set (digitH(k,j), ‘erase’, 'xoz', horizon! , 'center")+ 
> end 

Zend 


>fori l:max der. М Main loop 


> (0, center, obj _fen(i)] = stepfem(data, U, cluster а, expo); 
> fprintf( Iteration count = Xd, obj. fcn = fn’, і, obj, fen: 
> ifi >l, M check termination condition 

> И abs(obj _ fen i) — obj _fen(i- 1)) < min, impro. break; end, 
> end 

Dori = 1:6, 

> for k = 1scluster _n, 

> set(digitH(k,j), ‘pos’ s center(k, segs 0025 

> end 

> end 

> drawnow: 

Send 

Diter_n = i. % Plot of objection function 

figure: % New figure 


六 obj Ícnüter n-Fl:max iter) = [];% Delete unused elements 
>plot (obj _ fen); ахіз([1 i min(obj _ fen) max (obj _ fen) J); 
"title Objective Function for IRIS Data Clustering’); 

Z»xlabel ("Numbers of Iterations‘); 


、 关 于 使 用 MATLAB 中 小 波 变换 工具 箱 (toolbox) BRE ERA 
ES RET ETT 
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小 波 基 函数 : morlet hR, mexican hat(mexihar) /) # WH. 
HE: 9 
中 函数 不 存在 。 
一 基 函 数 不 正 交 。 
一 少 函 数 (psi) 不 致密 支撑 (compactly supported). 
一 重 构 性 质 不 保险 。 
可 能 分 析 : 
一 连续 分 解 。 
主要 优点 : Mk. 函数 有 显 式 。 
主要 困难 ; 没有 重 构 和 快速 算法 。 
2. ÆRIN itt (Infinitely regular wavelets) 
meyer 小 波 
HH. 
一 9 函数 存在 且 分 析 是 正 交 的 。 
一 中 函数 和 疯 数 是 无 限 可 导 的 。 
一 $ RRA o 函数 不 致密 支撑 。 
可 能 进行 的 分 析 : 
一 连续 变换 
一 Witt RRR. 
主要 优点 ; 对 称 ,无 限 规则 。 
主要 困难 : 无 快速 算法 。 
3. 正 交 有 致密 支撑 的 小 波 函 数 
Daubechies 小 波 函 数 (dbN)， coiflets / iit #8 C (сой) ,symlets УО 88 € (symN) 
жия. 
一 ?函数 存在 且 分 析 是 正 交 的 。 
— $ RRA 9 函数 是 致密 支撑 的 。 
可 能 进行 的 分 析 : 
一 连续 变换 。 
一 可 用 快速 小 波 变 换 (FWT) 进 行 离散 变换 。 
主要 优点 : 致密 支撑 ,存在 滤波 器 。 
主要 困难 : 规则 性 不 强 。 
特殊 性 质 ， 
对 于 dbN : ЖА} asymmetry), 
对 于 symN : 接近 对 称 。 
对 于 сойм. 接近 对 称 。 
A. ЖЕ Н ЭСЕ Ж ИЕЛЕ ЖО 
B- 样 条 双 正 交 小 波 函 数 ChiorNr, Nd). 
性 质 ， 
一 Ф 函数 存在 且 分 析 是 双 正 交 的 。 
一 进行 分 解 和 重 构 的 函数 和 PRAM LH, 
一 ЖЮН) Ф жя о ААД. 
一 可 进行 束 续 变换 。 
一 可 用 快速 小 波 变换 (FWT) 进 行 离散 变换 。 
主要 优点 : 对 滤波 器 而 言 是 对 称 的 。 


主要 困难 : 正 交 性 不 存在 。 
AX Daubechies 小 波 和 函数 的 信息 


家 族 名 : Daubechies 
RE. db 
KFN: N 为 正 整数 
例子 ， ЗЫ or haar, db4, db15 
正 交 性 ， yes 
双 正 交 性 : yes 
致密 支撑 : yes 
离散 小 波 变换 possible 
连续 小 波 变换 possible 
支撑 宽度 ， 2N~1 
滤波 器 长 度 : 2N 
对 称 性 ， 没有 


参考 文献 :I Daubechies, Ten lectures on wavelets, СВМ, SIAM, 61, 1994, 194-202. 
A coiflets ЛЗ НОЛЕ 


家 族 名 : Coiflets 
LC coif 
KEN; N= 1, 2004 5 
BE. coif2, coifd 
正 交 性 : yes 
PERE: yes 
致密 支撑 : yes 
离散 小 波 变 换 possible 
连续 小 波 变 换 possible 
IRRE.: $N—1 
滤波 器 长 度 : 6N 
对 称 性 : 接近 对 称 


参考 文献 : 1. Daubechies, Ten lectures on wavelets, CBMS, SIAM, 61, 1994, 258-261. 
Ж, MATLAB 中 小 波 工具 箱 使 用 示例 


例 1: 一 维 离散 小 波 变换 

1， 装 载 原始 一 维 信和 号: 

) load leleceumy 

) s = leleccum (1: 3920); 

) Is = length (s); 

2. 将 此 原始 一 维 信号 在 屏幕 上 面 出 来 ， 
) subplot (211); 

> plot (1; ls; sr); 

у title C Original signal s; 

3. 对 信号 用 Daubechies AER 《dbN) ， 进 行 一 步 分 解 ， 并 将 结果 在 屏幕 上 画 出 : 
У [eal, 201] = dwt (,/db1O; + 

> subplot (223); 

) plot (1: length (cal), cal); 
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у title (Approx. coef. : cat); 

) subplot (224); 

У plot (1: length (edl), cd; 

) title (Detail coef. ; edl); 

4， 对 所 得 分 解 系数 cal 和 ed] 进行 重 构 ， 并 将 结果 在 屏幕 上 画 出， 
)al = upeoefC a! seal,’ dbl',1,ls); 

) dl = upeoe[('d',cd1.'db1',1,15); 

Y hl = subplot(311)5 plot(1:lsysyr 7 

) utle('Original signal s. ">; 

3 h2 = subplot(312); plot(1:ls,aD 
y title(^ Approximation : al.')s 

> h3 = subplot (313); plot(l:ls,dl) 3 
) title Detail : dl. D; 
5. 对 所 得 41 和 d1 相 加 ,并 将 结果 在 屏幕 上 画 出 figure(acuve fig) 

hl = subplot(311); plot(1:]s.s, r2; 

tirle(' Original signal s 

h2 = subplot(312); plot(1.ls.al + dl); 

title(' Appzoximation + detail ; a] + d1.'); 

set h 1, Xrick' [7 Xticklabel [ 25 

6. JEBLBLEOIMR Si an ER. 

) a0 = idwt(cal,cdl, dbl',.ls); 

h3 = subplot (313); plot(1;1s,a0); 

title Reconstructed signal : að. °); 

7. ЖИВ 8 JB Daubechies 小 波 画 数 (dbN) ,进行 水 平 3 的 分 解 ,并 将 结果 在 屏幕 上 画 出 ; 
) [с.1] = wavedec(s,3,'dbl'); 

hl = subplot(511); plotC1 des. r); 


title Original signal в. °); 

8. 用 所 得 小 波 分 解 结构 [c, 上 j, 来 得 到 水 平 3 的 通 近 系数 ,并 将 结果 在 屏幕 上 两 出 : 

У ca3 == аррсоеЁ(с,1,'аЬ1',3): 

) h2 = subplot (5,8,9)+ plot(1;lengrh(ea3),ca3); 

) subplot (511) ; title C Original signal s and ca3，) 

9. FABRA Ek 2H E HT с 1], RS BIA 1,2,3 ih Ж Ж. A EB Hi: 
) саз = deteoef(c.1,3)5 

y ed2 = detcoef(c.1.2)+ 

) edl = deteoefc,l, D; 

> subplot (511); title Original signal s » ca3 and «03.'); 

>) h3 = subplor(5,8,17) ; plotC1:length (cd3) „с43); 

> pause (2) 

) subplot 511) ; title Original signal s , ca3, cd3 and cd2. 0; 

) h4 = subplot(5,4,13) « plotC1 length (cd2) .cd2); 

? pause(2); 

y subplot C511) ; title (Original signal s , ca3, cd3, cd2 and cd1. D ; 

> hā = subplor(5,2,9); plor(] length (cd) ,ed1) 

10. FUSE AB ve ya e] RAAB BUA 300 ЖЇЗ ЖО Ж ЖС. ЭЕ ЖЕЛЕР Ei : 
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? a3 = wreoef(‘a’,e,1,’dbl’,3); 

hl 

title Original sig. арр. level 3.) ; 

h2 = subplot (512); plot(1:1s.a3) ; 

11. FATE ЖНГ c1] oe (EI ZIOE 1,2 MRR MAR RRL: 

> dà = wrcoefCd' cil, dbl 3)5 

> 42 = wrcoef( d' c1, 'db1,25; 

>) dl = wreoef('d! cjl, db1',1)5 

subplot (511) ; titie("Original signal and аз 43 d2 41.'); 

h3 = subplot (513); plot(1:1s,d35 ; 

h4 = subplot (514); plot(1:1s,d2) ; 

h5 = subplot (515); plot(1;ls.d1) + 

12. 用 所 得 小 波 分 解 结构 [c, 由 ,来 重 构 分 析 信号: 

> a0 = waverec(e, l/dbl2; 

subplot(211); pletGs,'r'2; 

title( Original signal s."); 

subpiot(212) s plot (1:18 ,a02 ; 

title("Reconstructed signal a0. '); 

$2: Mallat 塔 式 算法 CWT) 示例 

1. 构建 原始 信号 ， 

ys = 2 + kron (ones (1, 8), [1 10) + C (1: 16). 2) 232 + 0.2 x randa. (1, 16); 

) subplot (311); plot (sy'r')+ 

) title (Original signal s.’)+ 

2. X — tE TE Be eB CH EE. 

) [Lo D, Hi. DJ = wfilters Cdbl' d^; 

Уух fl = 1: length (Lo. D); 

) subplot (323); wdstem (x fil, Lo_D,’y’); 

) xlabel (Lo _D 

У subplot (324); wdstem (x. fil, Hi. D.'y2; 

> xlabel CHi _ D-5 

3 检察 分 解 低 通 滤波 器 的 和 及 其 模 : 

) sm = sum (Lo D); 

? subplot (323); xlabel € [’Lo_D ; sum 一 , num2str (sm) D: 

) arm = norm (Lo _ D); 

) subplot (323); xlabel € [Lo _D ; norm = ', num2str (пгт) J); 

4. 用 Daubechies / d£ 83k. (dbN) 计算 信和 号 的 逼近 系数 ,首先 是 求 信和 号 s RUE AR IE OCA UAE R 
后 计算 它 的 二 分 的 下 采样 : 


) tempo = сопу (s, Lo_D)s 


subplot (511); plot(s,'r'); 


> subplot (312); plot (tempo); 

) title Cs and Lo. D convolution. '); 

) cal = dyaddown (tempo); 

) subplot (325); plot (cal); 

》xlabel (Approx. coef. : cal.'); 

y subplot (323); wdstem (x. fil, Lo_D,’y')s 
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) xlabel ('Lo_D."); 

) subplot (324); wdstem (x fl, Hi _D,'y'); 

) xlabel CHi_D."); 

5. 检察 分 解 高 通 滤 波 器 和 与 模 ， 

) sm = sum (Hi. D; 

У subplot (324); xlabel ( ['Hi_D : sum = ', numZstr (sm) D: 

)rm = norm CHi_D); 

) subplot (324); xlabel ( ['H1_D ; norm = ', num2str (nrm)]); 

6. Æ Daubechies 小 波 函 数 (ДЫМ) 计算 信号 的 细节 ， 首 先是 求 信号 s 和 高 分 解 滤波 器 的 卷 积 , 然后 计算 
它 的 二 分 的 下 采样 : 

) empo = conv (s, Hi. D); 

) ubplot (312); plot (tempo); 

) itle Cs and Ні D convolution. '); 

) 41 = dyaddown (tempo); 

? ubplot (326); plot (cd1); 

) label (Detail coef. ; ed1.'); 

7. 也 可 利用 离散 小 波 变换 一 步 计算 信号 的 逼近 系数 和 细节 系数 : 

> [1, edi] = dwt (s,'db1’); 

? subplot (3252; plot (cal, g'); 

) xlabel (Approx. coef. : са1.'); 

> subplot (326); plot (cdl,'g'); 

> xlabel (Detail coef. : edl.")s 

8. 下 一 步 显 示 怎样 用 两 个 重 构 滤波 器 来 进行 重 构 : 

) [Lo_R, Hi. RJ = wfilters Cdbl',/r2: 

} subplot (3233; wdstem (x fil, Lo _R,'y'); % plot (Lo R); 

У xlabel CLo_ R.O; 

) subplot (324); wdstem (x fil, Hi _R,'y'); % plot «Ні К); 

) xlabel CHi_R.")s 

> subplot (3212 : plot (cal,’g'): 

) title (Approx. coef. ; cal. 

) subplot (322); plot (ed1,'g’)s 

) title (Detail coef. :с41.'); 

9. 重 构 细节 系数 , 第 一 步 对 ed1 进 行 二 分 上 采样 计算 ,第 二 步 再 对 其 与 高 通 滤 疏 器 进行 卷 各 计算 ， 最 后 
对 所 得 结果 取 其 中 部 16 个 元 素 ， 即 进行 wkeep 运算 : 

У tempo == dyadup (cd1); 

) subplot (3132; plot (tempo); 

) xlabel Upsampled det. coeff. cd1. 3; 

) tempo = conv (tempo, Hi _R); 

? subplot (313); plot (tempo); 

? xlabel C Upsampled detail coeff. and Hi _ R convolution. '); 

) 41 = wkeep (tempo, 16); 

) subplot (313); plot (d1); 

> xlabel ("Reconstructed detail d1. '2; 

10, BHM ЖЖ. 第 一 步 对 cal 进 行 二 分 上 采样 计算 , 第 二 步 再 对 其 与 低 通 滤波 器 进行 卷 积 计算 , 最 后 
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对 所 得 结果 取 其 中 部 16 个 元 素 ， 即 进行 wkeep 运算 : 

) tempo = dyadup (cal); 

> subplot (313); plot (tempo); 

> xlabel 'Upsampled approx. coeff. cal'); 

) tempo = conv (tempo, Lo R); 

) subplot (813); plot (tempo); 

у xlabel ('Upsampled approx coeff. and Lo _ R convolution. '); 

yal = wkeep (tempo, 16); 

> subplot (313): plot (al); 

) xlabel (’Reconstructed approx. al.'); 

11. ЖЕНГЕ Ж ЮЖН ЖЫШ А. MAH RES 

dad =al + dls 

y tithe (Original signal s. 

У subplot (312); plot (1; 16, al, 1; 16, dD); 

у title Cal and dl.'); 

) h3 = subplot (313); plot (a0); 

) title (‘Reconstructed signal : aQ == al -~ dl; 

12. БУАЛАР В: 

) a0 = idwt (cal, cdl,'dbl'. 16); 

) subplot (313); plot (a0s'g); 

> title (Reconstructed signal а0. 'Э; 

俩 3， 用 小 波 变 换 对 一 维 信号 除 品 

1. 设 定 信 噪 比 和 随机 噪声 函数 的 种 子 , 产 生 带 有 高 斯 白 品 声 的 原始 信号 ,并 将 其 在 屏幕 上 显示 : 

) snr = 3; init = 2055635866; 

) [xref,x] = wnoise(3,11,snr,init); 

) subplet (311); 

) plot(xref,'r'), axis([1 2048 —10 10D; 

) title (Original signal’) ; 

> subplet (312); 

) plot(x g"), axis([1 2048 —10 10]; 

у ritle([* Noisy signal-Signal to noise ratio = ' ,num2str (fix (snr)) J); 

2. 用 水 平 5 的 小 波 sym Si 8 , BRE bs HE DA А HE Ba ЛЕ A ISI (heursure) f K ARERR WY fs SEAT ER 
LORHOGUEDER LER: 

) lev = 5; 

xd = wdentx,'heursure' ,'s' one! ,lev.'sym8); 

) subplot (313); plor(xd); axis([J 2048 —10 10]? 

> title(’ Denoised signal-heuristic SURE’); 

3， 用 水 平 5 的 小 波 sym 8 ER К.Л 3 bn HE AY Stein 的 无 偏 风险 估 讨 (Stein's Unbiased Risk Estimate) ЖШ 
Crigrsure) 的 软 去 品 模 式 对 信号 进行 去 噪 处 理 ,并 将 其 在 屏幕 上 显示 : 

) xd = wden(x,'tigrsure’ ,'s' ,'one' ,lev,'sym8'): 

) subplot (3132; plot(xd); axis([1 2048 一 10 107): 

title(‘Denoised signal-SURE’); 

4. 用 水 平 5 的 小 波 symB Bt BAGH HE D BI fË 22 sqrt (2 * log length COO AY ICI (satwolog) I EK £ MORE 
ANA SUE MUERE FERRER: 
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) xd = wden(x,'sqtwolog' ,'s' ,'sln' slev."sym8'); 


) subplot 313) plot(xd)s axis([1 2048 —10 10] 

> title’ Denoised signal — Fixed form threshold’); 

5. 用 水 平 5 的 小 波 syms RM, R Ж.Б BO E] A BL 2 B EJ PK H| (minimaxi) 的 软 去 品 模 式 对 信号 进行 
ВЕДИ КЕЕ ет. 

) xd = wden(x,’minimaxi’ ,'s' ,' sln” ,lev,"sym8'); 

> subplo1(313) plot(xd)s axis([1 2048 一 10 101) 

> title(Denoised signal-Minimax'); 

6. 用 水 平 5 的 小 波 sym8 函 数 , 先 对 信号 矢量 进行 分 解 ,以 得 到 它 的 分 解 结构 [c T) ARS TRE 

) [esl] = wavedec(x,lev 'sym8'); 

У xd = wden(c,1,’minimaxi ys ,'sln' ,lev,'sym8'2; 

7. 装载 一 个 分 析 信号 ,选择 其 中 一 部 分 ,首先 用 函数 ddencmp Ж BM wdenemp fH WH (B, 26 Hi Ж 
wdencmp 进行 除 澡 ,并 将 结果 在 屏幕 上 显示 ; 

? load leleccum ; indx = 2600:3100: 

у x = leleccum(indx) ; 

> subplot(211) ; 

) plot (indx,x,'r'), title’ Original signal) 

) [thr sorh keepapp] = ddencmp( den’ wv! 32; 

) xd = wdencmp('gbl x ,'db3' ,2,thr,sorh keepapp); 

У subplot(212) + 

? plotGindx,xd), title(/Denoised signal) 

8. 另 取 一 例 继续 试验 : 

Y init = 2055615866; 

) snr = 5i % signal to noise ratio. 

) [xref,x] = wnoiseC1 11 sanr,init) + 

У indx = linspace(0,1,length(x))s 

? subplot (211) ; 

) plot Gindx ,x,indx xref) 

? title( Noisy and Original signals’) 

) xlabel(["Signal to noise ratio = ' ,num2str(fix(snr)) J) 

У xd = wden(x,’heursure’,’s’,’one’ ,5,’sym8"); 

> subplot (212) + 

) plot (indx xd,indx, xref), xlabel(*Denoised and Original signals’) 

9. BER IG ,再 取 一 例 继续 试验 ， 

) snr = 4; % signal to noise ratio. 

) [xrefix] = wnoise(2,11,snr init) ; 

У indx = linspace(0,1,lengrh(x)); 

> subplot(211); 

) plot(indx,x,indx xref) 

> title( Noisy and Original signals) 

> xlabel(['Signal to noise ratio = ' .num2str(fix(snr))]) 

) xd = wden(x,‘rigrsure’ ,'s' ,'one' ,5,'sym4 2 

> subplot(212)+ 

) plot (indx xd ,indx xref)» xlabel('Denoised and Original signals’) 
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例 $: 用 小 波 变换 对 信号 进行 压缩 处 理 

1 装载 一 个 分 析 信号 ,选择 其 中 一 部 分 ,并 将 其 在 屏 莫 上 显示 ， 

) load leleccum; indx = 2600:3100; 

) х = leleccum(indx); 

> subplot (211); 

) plot (indx,x,’r'), title (Original signal! ) 

2. 用 函数 wdencmp 来 进行 信号 压缩 , 采用 固定 网 值 (35), 并 将 结果 在 屏 莫 上 显示 : 

) thr = 35; 

) [xd,cxd,lxd,perf0,perf12J = wdencmp(’gbi’ ,x,’db3’ ,3,thr,'h',1); 

) subplot (212); 

> plot Gndx.xd), title Compressed signal’) 

> xlabel(['2-norm rec. ; ' numZstr(perfi2,' % 5. 2/2, 
И - nul cfs: " ,num2str(perf0,' $65. 210, ' 96D 

3 装载 -图像 信号 ,并 将 其 在 屏幕 上 显示 ， 

) load womans x = X(100:200,100:200); 

> nbe = size(map,1); 

> colormap(pink(nbc)); 

) imageCwcodemat (x nbe)), title( Original image’) 

4 FRM wdencmp 来 进行 图 像 信号 压缩 ,并 将 结果 在 屏幕 上 显示 : 

dn = 5; w = ‘sym; 

3] = wavedec2(x,n v); 

> thr = 20; 

) [xd,cxd,1xd ,perf0,perfl2] = wdencmp('gbl sce,l wn thz,/b/ 10; 

) image (weodemat (xd ,nbe)) 

> title([’Compressed Image. Threshold = ' ,num2str(thr)]) 

) strxlab == strveat([’2—norm rec. ; ' ,num2str(perfl2,' 1⁄5. 2) 4], 
[nul cfs ; ' ,num2str(perf0,” 5.2 ),' 96i 

> xlabel(strxlab); 


> axis('square/2; 
75. MATLAB 中 人 工 神经 网 络 程序 使 用 示例 


gh. 

1. 先 定 义 输入 矢量 P: 

УР = [--3.0 +2.0]; 

2. 定义 目标 矢量 T， 

T = [0.4 +0.8]; 

3. 用 ERRSURF 函数 计算 用 一 个 神经 元 计算 在 可 能 的 权重 和 偏 置 范围 内 的 误差 ,并 用 PLOTES 函数 画 
出 误差 图 和 等 高 线 图 ; 
Ф444 
)bv = -4:0.4;4; 


) es = errsurf(P, T,wv,bv 'logsig'); 

> plores(wv,bv,es,[60 30])s 

误差 图 中 史 最 小 信 即 为 最 好 点 。 

4. 用 INITFF 函数 来 对 LOGSIG 神经 元 的 权重 和 偏 置 进行 初始 化 : 
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> [wb] = initff(P,T,’logsig’ ) 


w= 
1.1230 
b= 
—0. 9456 
5. 给 出 必要 参数 ,用 了 TBP1 函 数 (一 层 前 传 误差 反 传 网 络 ) 训 练 人 工 神 经 网 络 : 
df = 5: M Frequency of progress displays (in epochs). 


?me = 100; % Maxitnum number of epochs to train. 

deg = 0 01;% Sum-squared error goal. 

dir = 2s 3⁄4 Learning rate. 

У Cwebsepser] = thpl (wb, logsig' P, T. [dí me eg lr] wvsbv es [60 302; 
以 下 为 屏幕 显示 : 


TRAINBP: 0/100 epochs, SSE = 0. 985712. 
TRAINBP: 5/100 epochs, SSE = 0, 970767. 
TRAINRP: 10/100 epochs, SSE 0.779827. 


TRAINBP; 15/100 epochs, SSE 0. 531896. 
TRAINBP; 20/100 epochs, SSE = 0.154784. 
TRAINBP, 25/100 epochs, SSE = 0. 0438716. 
TRAINBP: 29/100 epochs, SSE = 0. 00887375. 
该 程序 的 输出 参数 为 : 
w: 权 重 结 果 ; 
b: 偏 置 结果 ; 
ep: 训 练 总 次 数 ; 
tr: 误 差 记录 。 
用 下 述 绘图 函数 可 看 出 训练 次 数 与 误差 的 关系 : 
) ploterr(tr,eg); 
还 可 用 simuff 函数 来 验证 是 否 可 由 任意 给 定 输入 而 得 到 目标 值 ; 
在 本 例 , 给 一 3 应 得 到 目标 值 0. 4; 

给 十 2. 0 应 得 到 目标 值 二 0. в. 
)p = -1.2; 


da ruff (p.wb,'logsig’) 


0. 4881 

例 2: 

L 先 定义 输 和 人 矢量 P， 

YP = 一 一 1:1:1 

2. 定义 目标 矢量 工 ; 

T= [-.9602 —.5770 —.0729 +3771 + 8405 + 6600 + 4609 
.1336  —.2013  —.4944  —.5000 一 .3930 —. 1647 - 0988 
-3072 +3960 +8449 .1816 —.0312  —.2189 -–. 3201 J: 

3. 用 作 图 程序 来 观察 一 下 输入 与 输出 的 非 线性 关系 : 

plot CP, T. +); 


title Training Vectors‘); 
xlabel ("Input Vector Р’) = 
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ylabel( Target Vector T 
4. 设计 网 络 ， 

本 饮用 -- 
》S1 = 
з. JR INITFE 函数 来 对 网 络 的 权重 和 偏 置 进行 初始 化 : 
》[wl,blyw2,b2] = initff(P.S1, tansig' .了 ,purelin' )， 
6 给 出 必要 参数 ,用 trainbp GRR HK AT HAAS : 

> di = 10; 56 Frequency of progress displays (in epochs). 


网 络 ,TANSIG 转换 函数 和 purelin 转换 函数 为 其 神经 元 ,S1 为 其 隐 含 层 神经 元 个 数 


J me = 8000; % Maximum number of epochs to train. 
) eg = 0.02: % Sum-squared error goal. 

yr = 2.01; % Learning rate. 

у tp > [df me eg Ir]; 

》[wl,51,w2,b2vepytr] == trainbp (wl bl, tansig’ .w2,b2.'purelin’ ,PT tp); 
以 下 为 开幕 显示 ; 

TRAINBP. 0/8000 epochs, SSE = 7.93707. 
TRAINBP; 10/8000 epochs, SSE = 1. 29622. 
TRAINBP: 20/8000 epochs, SSE = 3. 78964. 
TRAINBP; 30/8000 epochs, SSE = 3. 36207. 
TRAINBP: 40/8000 epochs, SSE = 2. 99139. 
TRAINBP; 50/8000 epochs, SSE = 2. 66459. 
TRAINBP; 60/8000 epochs. SSE = 2. 37366. 
TRAINBP: 70/8000 epochs, SSE ~ 2. 11346. 
TRAINBP; 80/8000 epochs, SSE = 1. 88035. 
TRAINBP; 90/8000 epochs, SSE = 1. 67151. 
TRAINBP; 100/8000 epochs, SSE = 1. 48453. 
TRAINBP: 110/8000 epochs, SSE = 1. 31726. 
TRAINBP: 120/8000 epochs, SSE = 1. 16777. 
TRAINBP; 130/8000 epochs, SSE = 1.03428. 
TRAINBP: 140/8000 epochs, SSE = 0. 915206. 
TRAINBP: 150/8000 epochs, SSE 一 0. 809095, 
TRAINBP: 160/8000 epochs, SSE = 0. 714641. 
TRAINBP, 170/8000 epochs, SSE = 0. 630665. 
TRAINBP, 180/8000 epochs, SSE — 0. 556099, 
TRAINBP， 190/8000 epochs, SSE — 0, 489974. 
TRAINBP: 200/8000 epochs, SSE = 0. 431414. 
TRAINBP. 210/8000 epochs, SSE =" 0. 379622. 
TRAINBP: 220/8000 epochs, SSE == 0. 333877. 
TRAINBP; 230/8000 epochs, SSE = 0. 293524. 
TRAINBP,; 240/8000 epochs, SSE = 0. 257972. 
TRAINBP. 250/8000 epochs, SSE = 0. 226687. 
TRAINBF: 260/8000 epochs. SSE = 0. 199185- 
TRAINBP, 270/8000 epochs. SSE = 0. 175034. 
TRAINBP. 280/8000 epochs, SSE == 0. 153844. 
TRAINBP: 290/8000 epocbs, SSE = 0. 135269. 
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TRAINBP ; 300/8000 epochs, SSE = 0. 118996. 
TRAINBP; 310/8000 epochs, SSE = 0, 10475. 
TRAINBP: 320/8000 epochs, SSE 0. 092284. 
TRAINBP: 330/8000 epochs, SSE 0. 0813809. 
TRAINBP: 340/8000 epochs, SSE = 0. 0718476. 
TRAINBP ; 350/8000 epochs, SSE 0. 0635139. 
TRAINBP: 360/8000 epochs, SSI 0. 0562296. 
TRAINBP, 370/8000 epochs, SSE == 0. 0498628. 
TRAINBP: 380/8000 epochs, SS] 0. 0442973. 
TRAINBP:; 390/8000 epochs, SSE 0. 0394315- 
TRAINBP, 400/8000 epochs, SSE — 0. 0351761. 
TRAINBP: 410/8000 epochs, SSE = 0. 031453. 
TRAINBP: 420/8000 epochs, SSE = 0. 0281939. 
TRAINBP: 430/8000 epochs, SSE = 0. 0253393. 
TRAINBP: 440/8000 epochs, SSE = 0. 0228372. 
TRAINBP: 450/8000 epochs, SSE 0. 020642. 
TRAINBP: 454/8000 epochs, SSE 0. 0188409. 


该 程序 的 输出 参数 为 : 

wl— #-BREAR: 

bl— E WR; 

w?2 一 一 第 二 层 权 重 结果 ; 

b2— EM Rs Ж: 

ер cM ak k; 

tr 一 -误差 记录 。 

т 用 下 述 绘图 函数 可 看 出 训练 次 数 与 误差 的 关系 ， 
? ploterr(tr seg) s 

还 可 用 simuff 函数 来 验证 是 否 可 由 任意 给 定 输 人 而 得 到 目标 值 ; 
在 本 例 ,给 0. 5 应 得 到 目标 值 0. 3506， 

Ур = 0.5; 

) a == simuff(p, wl ,b1,’tansig! ,w2,b2'purelin”) 


а= 
0.3506 

i3. 一 个 羽 合 度 不 够 (UNDERFITTING) 的 示例 

1. 先 定义 输入 矢量 P: 

Ур = —1::1;1; 

2. 定义 目标 矢量 T， 

T = [—. 8602 一 .5770 —.0729 .3771 .6405 . 6600 . 4609 = 


+1336 —. 2013 — 4344 —. 5000 --. 3930 —. 1647 . 0988 … 


. 3072 . 3960 , 3449 .1816 —. 0312 ~. 2189 —. 3201]; 
3. 用 作 图 程序 来 观察 一 下 输入 与 输出 的 非 线性 关系 
plot(PsT y+: 
ае Training Vectors')s 
xlabel( Input Vector P2; 
ylabel Target Vector T 
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4. 设计 网 络 : 
本 例 用 -- 二 层 网 络 ,TANSIG 转换 函数 和 purelin PRB HMMA SIRES HBT RAS 
元 个 数 太 少时 ,容易 导致 拟 合 度 不 够 ) : 
S= 2; 
5, 用 INITFF pg aoe ВО R RIN W AE EL: 
) [wl,bl.w2,b2] = initffCP S1, 'tansig T ,'purelin’ ) ; 
6. 给 出 必要 参数 ,用 tainm 函数 来 训练 人 工 神经 网 络 : 
) df = 10; % Frequency of progress displays (in epochs). 
) me = 200  % Maximum number of epochs to train, 
у eg = 0.02; % Sum-squared error goal. 
) tp = df me eg ]; 
y [wl bl.w2,b2,ep.tr] = trainlm(w1,b1, tansig! ,w2.b2,‘purelin’ ,P,T tp); 
以 下 为 屏幕 显示 : 
TRAINLM: 0/200 epochs, mu = 0.001, SSE = 33. 3699, 
TRAINLM, 10/200 epochs, mu = 0.1, SSE = 2.15034. 
TRAINLM; 20/200 epochs, mu = 0. 001, SSE = 0. 729464. 
TRAINLM: 30/200 epochs, mu = 0.001, SSE = 0. 724132. 
TRAINLM: 40/200 epochs, mu = 0.001, SSE = 0. 722526. 
TRAINLM, 50/200 epochs, mu = 0. 0001, SSE = 0. 719605. 
TRAINLM: 60/200 epochs, mu = 0.0001, SSE = 0. 718858. 
TRAINLM: 70/200 epochs, mu = 0.0001, SSE = 0. 718515. 
TRAINLM: 80/200 epochs, mu = 0. 0001, SSE = 0. 718307. 
TRAINLM; 90/200 epochs, mu = 1e—005, SSE = 0. 717681. 
TRAINLM: 100/200 epochs, mu = 1e—005, SSE = 0. 71749. 
TRAINLM; 110/200 epochs, mu = Je—005, SSE = 0. 717395. 
TRAINLM: 120/200 epochs, mu = 1e—005, SSE = 0. 717335. 
TRAINLM: 130/200 epochs, mu = le—005, SSE = 0. 717293. 
TRAINLM. 140/200 epochs, mu = 1e—005, SSE = 0.717261. 
TRAINLM: 150/200 epochs, mu = 1e—006, SSE = 0.717138. 
TRAINLM; 160/200 epochs. mu = 1е— 006. SSE = 0.717083. 
TRAINLM: 170/200 epochs, mu = le—006, SSE = 0. 717055. 
0. 
0. 
0 


epee Pp Pee? 


TRAINLM; 180/200 epochs, mu = le 一 006, SSE = 0. 717037. 
TRAINLM: 190/200 epochs, mu = 1e—006, SSE = „717024. 
TRAINLM: 200/200 epochs, mu = le—006, SSE = 0.717014. 
TRAINLM: Network error did not reach the error goal. 

Forther training may be necessary, or try different 

initial weights and biases and/or more hidden neurons. 
此 结果 说 明 用 TRAINLM UI RZ TS BE A. 
Bla. 一 个 过 氢 合 (OVERFITTING) 的 示例 
1， 先 定义 输入 矢量 P 和 目标 矢量 T: 
Ур = -1::1:1: 
.9602 一 .5770 一 .0729 .3771 .6405 .6600 .4609 = 
,1336 一 .2013 —.4344 一 - 5000 —. 3930 —. 1647 .0988 … 
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-3072 .3960 .3449 .1816 一 .0312 —. 2189 —. 3201]; 

2. 用 作 图 程序 来 观察 一 下 输入 与 输出 的 非 线 性 关系 : 

PilotCPT，- š 

tile('Traming Vectors’ }; 

xlabel('Input Vector P'); 

ylebel Target Vector T'); 

à 设计 网 络 ， 

本 例 用 一 二 层 网 络 ,TANSIG 转换 函数 和 purelin 转换 函数 为 其 神经 元 ,S1 为 其 鳃 含 层 神经 元 个 数 ( 隐 含 
层 神经 元 个 数 太 多 时 ,容易 导致 过 拟 合 ): 

)Š1 = 46; 

4 用 INIT FR 函数 来 对 网 络 的 权重 和 偏 置 进行 初始 化 : 

> [wl,bl,w2,b2] = initff(P,S]， tansig , T ,purelin ) 

5. 给 出 必要 参数 ,用 trainlm 函数 来 训练 人 工 神经 网 络 ， 

) df = 10; % Frequency of progress displays (in epochs). 

) me +8000; % Maximum number of epochs to train. 

) eg = 0.02; М Sum-squared error goal. 

> tp = [df me eg ]; 

У (w1,bl.w2,b2,ep.tr] = trainlm wl b], tansig! »w2.b2,'purelin’ PT stp) s 

以 下 为 屏幕 显示 : 

TRAINLM: 0/8000 epochs, mu = 0.001, SSE = 73, 6058. 

TRAINLM: 4/8000 epochs, mu = 3,001, SSE = 0. 0186811. 

SSE 的 结 加 已 经 达到 日 标 。 

6. 用 下 述 绘图 函数 可 看 出 训练 次 数 与 误差 的 关系 : 

? ploterr(treg); 

7. 用 simuff 两 数 来 验证 目标 曲线 的 拟 合 情 况 ,并 将 结果 在 屏幕 上 显示 : 

УР2 = -1;0. 01:1; 

> A = simuff (P2, W1,b1 ,'tansig’, W2,b2,'purelin’)+ 

> plot(P.T,’ +" P2,A,/m2; 

) title (Testing the Network’); 

> xlabel(Input Vector P'); 

) ylabel Target Vector T'); 

此 结果 说 明 TRAINLM 训练 由 40 个 降 项 层 结 点 的 神经 网 络 ,很 容易 产生 过 拟 合 。 

例 5， 一 个 用 人 工 神经 网 络 来 进行 英文 字母 识别 的 例子 : 

1. 首先 装载 数据 :函数 prprob 将 给 出 两 个 矩阵 ,一 个 矩阵 alphabet 为 一 

> [alphabet targets] = prprobs 

) [R:Q] = size(alphabet? ; 

BM prprob 将 给 出 两 个 矩阵 ,其 中 alphabet Jj — (35 X 26) EH, Т f] 89 — A Gs — 1-5 ER GL ES (bit 
map) stargets 为 一 (26X 26) 阶 的 单位 矩阵 ERR TERR EE A 的 标识 为 一 个 第 
一 个 元 素 为 1, 其 余 元 素 为 0 的 矢 最 1 巩 字母 Z 的 标识 则 为 一 个 第 26 个 元 素 为 1, 其 余 元 素 为 0 的 矢量 。 

用 下 列 程序 可 清楚 地 看 出 每 一 个 字母 的 位 图 

) for k=1:26 


) for і=1:7 


у for j=1:5 
› аб, К) =alphaber((i— 1) #54}: 
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) end 

? end 

У end 

2. 设计 网 络 : 

本 例 用 -- 二 层 网 络 , 仍 用 logsig 转换 函数 为 其 神经 元 ,S1 为 其 隐 依 层 神经 元 个 数 : 
)S1 = 16 

З. FA INIT RE iR И 09 E ЖИЙ Be fT ИЕ: 

> W1,b1,W2,b2] = initff (alphabet, S1 ,"logsig! targets,’ logsig’) + 
) W2 = W2*0.01; 

)b2 = b2* 0. 01; 

4. 给 出 必要 参数 ,用 trainbpx 函数 来 训练 人 工 神经 网 结 ， 


) df = 20; 5⁄4 Frequency of progress displays (n epochs). 
) me = 5000;  % Maximum number of epochs to train. 
deg = 015 3⁄4 Sum-squared error goal. 

) me = 0.95; % Momentum constant. 


) tp = [df me eg NaN NaN NaN mc]: 
> P = alphabet; 
) T = targets; 
У [W1,b1,W2,b2,ep.tr] = trambpx(W1,b1, ‘logsig’ , W2,b2,'logsig’ PT t); 
UA КЖ RSE A 
TRAINEPX; 0/5000 epochs, lr = 0.01. SSE = 168. 808. 
TRAINBPX; 20/5000 epochs, lr = 0.026533, SSE = 26. 6316. 
TRAINBPX: 40/5000 epochs, ir = 0. 0500319, SSE = 25. 0037. 
TRAINBPX: 60/5000 epochs, lr == 0. 0500319, SSE = 
TRAINBPX, 80/5000 epochs, Ir -* 0. 0814967, SSE = 25.173. 
TRAINEPX, 100/5000 epochs, Ir = 0. 216235, SSE = 25. 0259. 
TRAINBPX. 120/5000 epochs, Ir = 0.573736, SSE = 24. 3849. 
TRAINBPX, 140/5000 epochs, Ir = 1. 52229, SSE = 22.1595. 
TRAINEPX, 160/5000 epochs, Ir = 4. 03909, SSE = 15.05]. 
ТЕАІМВРХ, 180/5000 epochs, Ir = 10. 7169, SSE = 5. 05021. 
TRAINBPX : 200/5000 epochs, Ir = 28.4352, SSE = 0. 863142. 
TRAINBPX , 208/5000 epochs, lr = 42.0117, SSE = 0. 0984008. 
达到 目标 ,训练 结束 。 
5. 训练 仿 噪声 的 数据 ， 
先 将 原 训练 结果 转 人 Win ,bln 、W2n 、b2n, 以 备 训练 含 噪声 的 数据 用 ， 
У Win = Wl; bin = bl; W2n = W2; hZn = b2; 

给 出 相应 参数 ， 


) me = 300; % Maximum number of epochs to train, 


5. 1697. 


уед = 0.6; М Sum-squared error goal- 

) tp = [df me eg]; 
HIEKE OLR ROC US MR 

) Т = [targets targets targets targets J; 


5 


) for pass = 
) fprintf Pass = 342. 0f\n’ spass) s 


у Р = [alphabet alphabet, += 


> (alphabet + randn(R,Q) * 0.1), + 

) (alphabet + randn (R ,Q) * 0.2255 

у [Win.bln,W2n,b2n;ep,tr] = 
trainbpx(W In bin,’ logsig’ , W211, b2n,'logsig’ PT tp); 

? end 


结果 显示 ， 
fprintf C Pass = 942. Of\n' ,разѕ) 
Pass = | 
TRAINBPX: 0/300 epochs. Ir = 0. 01, SSE = 4. 31546. 
TRAINBPX; 20/300 epochs, lr = 0.026533, SSE = 2. 39066. 
TRAINBPX: 40/300 epochs, ir = 0. 0703999, SSE = 1. 43271. 
TRAINBPX: 60/300 epochs, Ir = 0. 186792, SSE = 0. 961293. 
TRAINBPX; 80/300 epochs, Ir = 0. 495614, SSE = 0. 695128. 
TRAINBPX: 89/300 epochs, lr = 0. 768861. SSE = 0. 592093. 


end 
fprintf Pass = $62. Of\n' pass? i 
Pass — 2 


[Win,bin,W2n,b2n,ep,tr] = trambpx OW In bin, logsig’ Wen ,b2n ,'logsig! PT tp): 
TRAINBPX; 0/300 epochs, lr = 0.01, SSE = 3. 22597. 
TRAINBPX; 20/300 epochs, lr = 0.026533, SSE =: 1. 89788. 
TRAINBPX; 40/300 epochs, lr = 0.0703999, SSE = 1. 33045. 
TRAINBPX: 60/300 epochs, lr = 0.186792, SSE = 0. 976347. 
TRAINBPX: 80/300 epochs, Ir = 90.495614, SSE = 0. 725668. 
TRAINBPX; 92/300 epochs, Ir = 0, 890052, SSE = 0. 590583. 


1 
е 


end 
Íprintí( Pass = 002. OfNn' pass) + 
Pass = 3 


Р = [slphabet, alphabet. ++ 
[Win.din, W2n,b2n,ep,tr] = trainbpx(Win, bin,’ logsig’ ,W2n .b2n,’logsig’ ,P.T tp); 
TRAINBPX: 0/300 epochs, Ir = 0.01, SSE = 5.07201. 
TRAINBPX; 20/300 epochs, Ir = 2.026533, SSE = 3. 03126. 
TRAINBPX; 40/300 epochs, lr = 0. 0703999, SSE = 1. 59253. 
TRAINBPX 60/300 epochs, lr = 0. 186792, SSE := 0. 968169. 
TRAINBPX. 80/300 epochs, Ir = 0. 495614, SSE = 0. 653241. 


TRAINBPX: 85/300 epochs, Ir = 0. 632544, SSE = 0. 597847. 
end 

fprintf('Pass = %2. Of\n! pass); 
Pass = 4 


Р = [alphabet, alphabet, «+ 

[Win bln, W2n.b2n.ep.tr] = trainbpx(W1nsbla,‘logsig’ W2n .b2n.’logsig’ PT tp); 
TRAINBPX: 0/300 epochs, Ir = 0,01, SSE = 4, 01717- 
TRAINBPX. 20/300 epochs, lr = 0.026533, SSE = 2. 94552. 
TRAINBPX,; 40/300 epochs, Ir = 0. 0703999, SSE = 1. 72363. 
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TRAINEPX; 60/300 epochs, Ir = 0. 186792, SSE = 1.04955. 
TRAINEPX: 80/300 epochs, Ir = 0.495614. SSE = 0.695784, 
TRAINBPX: 87/300 epochs, lr = 0.697379, SSE = 0, 59675. 


end 


роп (Pass = 5⁄2, Of\n' pass? 


Pass = ï 
P = [alphabet, alphabet. ++ 
[Win bin, W2n,b2n-epstr] = trainbpx(W In bln. logsig! ,W2n .b2n.'logsig’ P T, tp); 
TRAINEPX: 0/200 epochs, lr = 0.01, SSE = 2. 72573. 
TRAINBPX ; 20/300 epochs, Ir = 0.026533. SSE 1. 69701. 
TRAINBEX; 40/300 epochs, lr = 0. 0703999, SSE = 1. 00911. 
TRAINBPX: 60/300 epochs. Ir = 0, 186792. SSE = 0.691741. 
TRAINBPX 69/300 epochs, ir = 0.289775, SSE = 0. 598231. 


end 
WAR. 
6. REACTOR ПЕШ БЕРТИК ЕТЕ PERI AH EB ЖЫ ЖЕ АЕН ЖЕ ШЙ Ж p ЖОЮ RE, 
ydf = 5: % Frequency of progress displays (in epochs). 
Уле = 500; 7 Maximum number of epochs to train. 


Seg d. Sum-squared error goal. 
Ytp = За me eg]; 
> P = alphabet; 
УТ = targets; 
) (Win, bln, W2n,b2n.ep.tr] = trainbpx (W In. bin, 'logsig’ «W2n sb2n.'logsig' «PT tp); 
ARER: 
TRAINBPX: 0/500 epochs, lr = 0.01. SSE = 9, 0642643. 
组 需 训 练 即 可 得 到 正确 结果 。 
7。 比 赤 经 含 噪声 训练 所 得 结果 (netwerk2) 与 不 含 噪声 训练 所 得 结果 (network1) 是 否 不 同 给 出 检验 参 


) noise range = 0,.05;.3; 
) max _ test 一 100: 
У network] = [ 7: 
> network? = [ ]; 
УТ 一 targets; 
执行 检验 ， 
› for naiselevel = noise _ range 
) {рїї Testing networks with noise level of 06. 2f. Nn' -noiscleve : 
) Testing networks with noise level of 0. 00. 
) errors] = 0i 


) errors2 = 0: 


for i= 1. тах _ test 


Р = alphabet ~ randn(35.26) * noiselevel ; 

) А = simuff(P,W1.b1, ‘logsig’ ,W2,b2,'logsig ) : 

› AA = compet(A); 

) errors] = errors] + sum(sum(abs(AA—T)))/25 % &® NETWORK 1 


› An = simoff(PsW1n,bIn,’logsig’ ,W2n,b2n.’logsig’)s 
› AAn ~ compet(An); 
> eors? = errors2 | sum(sum(abs(AAn- T)))/2; 
) echo off 
以 下 为 屏幕 显示 结果 : 
Testing networks with noise level of 0. 05. 
Testing networks with noise level of 6.10. 
Testing networks with noise level of 0. 15. 
Testing networks with noise level of 0, 20, 
Testing networks with noise level of 0. 25. 
Testing networks with noise level of 0. 30. 
Testing networks with noise level of 0. 35. 
Testing networks with noise level of 0. 40. 
Testing networks with noise level of 0. 45. 
Testing networks with noise level of 0. 50. 
用 图 将 检验 结果 显示 出 来 : 
? dt 


) plot(noise  range;networkl * 100, 


noie _ range network? + 100); 


) title( Percentage of Recognition Errors’); 
) xlabel Noise Level); 
) ylabel(’Network 1 _ _ Network 2 NN AND: 
METAS. SERRA AAS R (nerwork2) 5j s URS | RET BER Cnerwork1) - 


+. RARE ERR 


Т. 实数 遗传 算法 程序 中 的 变量 说 明 

psize 染色 体 个 体 数目 ( 即 需 主 优 的 参数 的 个 数 } 
pmutate ERE 

mutatec RHK 


сус 循环 次 数 
step 步 长 
popu 染色 体 


popuerr ”与 染色 体 ( 即 需 调 优 的 参数 ) 对 应 的 误差 
errflow 误差 流 

popufit 染色 体 适应 性 

son 1 交叉 子 代 

son2 变异 子 代 

sonerr 与 子 代 对 应 的 误差 

sonfit 子 代 的 适应 性 

parent RA 

offspr 通过 竞争 产生 的 新 于 代 


matesite 交叉 点 
fitsum 适应 性 的 总 和 
site 变异 点 


2. 实数 遗传 算法 程序 所 包含 的 子 程序 
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mate. 交叉 函数 

compet. m 竟 争 函数 

fitness. m ЖЛЕ 

mutate. т 变异 函数 

selectum ”选择 性 交叉 函数 

3. 构建 一 个 遗传 优化 的 主 程序 

因此 帝 传 优化 函数 是 为 求 极 大 设计 的 , 故 如 要 求 极 小 时 R H Ar ROC 。 
tga. m 


psize == 20 ;pmutate=0. 3;mutatec =0. 001; 


cyc==0;step=oncs(1.psize) x 0. 001; 
popu=rand(3,psize) — 0. 2; 
popuerr— Imsob(popu,x1,y1); 
errflow=[_; 

while сус<0500 

tyt—eye--1; 

errflow = [errflow ,popuerr(1)]; 
pepulit = fitness(popuerr); 
parent = select (popufit) ; 

son] =mate(poput: parent) ) ; 


ѕоп2 — mutate(son] ,pmutate ,mutatec); 


sonl,son2]; 
sonerr=l1msob(son,x]1,y1); 
sonfit = fitness(sonerr); 
popu [popus,son ]; 
popufit 一 [popufit ,sonfit J; 
popuerr = [popuerz ,sonerr]; 
offspr—compet (popufit  psize) ; 
popu= popu( ; ,offspr); 
popuerr = popuerr (offspr); 
end 
plot (errflow) 
disp('The optimal individual is’ ) 
рори; .1) 
1 结果 检验 
Tpletixl* popu(: ,1)) 
> hold 
—>plot(y1 r) 
说 明 : Dice ob MRR, ЖАВОБНИ, ML FAR (pmutate)、 变 异步 长 
(mutatec) | HIRKA (oye), HK (step) 等， 不 正确 的 参数 选择 将 可 能 得 到 的 是 局 部 最 优 , 更 一 般 说 来 , 遗 
传 算法 还 是 依赖 所 需 解 决 问题 的 特殊 性 的 ， 所 以 ， 在 使 用 上 述 程序 时 应 加 以 注意 。 
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一 、 化 学 计量 学 中 常用 名 词 中 英文 对 照 表 


ASTM 红外 光谱 索引 


Bayes 判别 法 
半 因 子 设计 法 

半 正 定 

饱和 设计 

饱和 已 最 优 设计 
R A 

比特 

变 尺度 法 

变量 

变换 

编码 

编码 信息 量 

编码 效率 

变 步 长 通用 模拟 运 火 法 
标准 加 入 迁 代 目标 转换 因子 分 析 法 
标准 化 

病态 体系 

波动 噪声 

波 数 

波长 

不 等 性 方差 

部 分 因子 设计 
不 确定 度 


采样 理论 
采样 常数 
REESE 

残 差 双 线 性 分 解 千 
产生 子 
产生 式 规则 表达 


A 
ASTM infrared spectral index 


B 


Bayes discrimination 
half-Fraction factorial design 

positive semidefinite 

saturated design 

saturated D-optimal design 

breakdown point 

bit 

variant scale method 

variable 

transformation, 

coding 

coding information 

coding efficiency, CE 

variable step-size generalized simulated annealing 
standard addition iterative target transformation factor analysis 
normalization 

Til-conditioned system 

fluctuation or flicker noise 

wave number, WN 

wave length, А 

heteroscedastic variance 

fractional factorial design 


uncertainty 
c 


sampling theory 
sampling constants 
residual normal plor 
residua] bilinearization 
generator 


generating rule expressing 


Жжж 

LLLI 

窗口 Fourier 变换 
窗口 移动 平均 法 
窗口 移动 中 位 数 半 滑 
窗口 因子 分 析 法 
重复 中 位 数 法 
Bn 

纯 分 析 物 种 的 秩 
尺度 

尺度 两 数 
REWE 

尺度 向 量 

次 轴 

抽检 特性 曲线 
抽出 误差 
HEPTANE 
RT 
ЖКА 


如 -最 优 设计 
代表 性 采样 

单位 矩阵 

单纯 形 优化 
单纯 形 试 验 设计 法 
单纯 形 格子 点 
单纯 形 格子 设计 
单纯 形 重心 设计 
单个 中 位 数 法 
等 价 定理 

等 性 方差 

得 分 矩阵 

选 代 目标 转换 因子 分 析 法 
定义 关系 

定义 相反 

定量 结构 活性 关系 研究 
定量 结构 性 质 关系 研究 
定量 测定 限 

独立 性 

短 时 Fourier ER 

对 称 矩阵 

多 步 法 

多 分 辩 


power method 
multiple congruential method 
windowed Fourier Transform, WET 
window moving average method 
window moving median smoothing 
window factor analysis 

repeated median method 

net analytical signal. NAS 

net analyte rank, NAR 

scahng 

scaling funcninn 

scaling filter 

scaling vector 

secondary axes 

operating characteristic curve 
extracted Error. XE 

roughness penalty smoothing method 
cluster terms 


soft independent modeling of class апа ову, SIMCA 
D 


D-optimal design 

representative sampling 

idenuty matrix 

simplex optimization 

simplex experiment design 

simplex lattice point 

simplex lattice design 

simplex gravity center design 

single median method 

equivalence law 

homoscedastic variance 

scores matrix 

iterative target transformation factor analysis 
defining relation 

defining contrast 

quantitative structure-activity relationsaip, QSAR 
quantitative structure-property relationship. QSPR 
quantitative detection limit 

independence 

short time Fourier transform, STFT 
symmetric matrix 

multistep method 


multiresolution 
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多 分 辨 分 析 

多 分 辨 信号 分 解 
多 环 芳烃 
S29 

多 元 校正 

多 元 线性 回归 方法 


二 次 饱和 D-RE 


F- 

-检验 

Fisher 判别 法 
Fourier 3E fk 

范围 标 度 化 
方差 分 析 

方差 平方 和 法 
方 阵 

非 均匀 性 

非 奇异 矩阵 

非 线性 分 析 体 系 
非 线性 送 代 偏 最 小 二 乘 算 法 
分 辨 率 

СЕД 

分 层 采样 

28 

ABRE 

分 析 化 学 品质 因数 
分 析 信和 号 

分 析 信 息 理论 

分 析 物 -内 标 参考 相关 法 
分 于 结构 编辑 模块 
DF SREB 
分 子 拓扑 指数 

分 子 图 
分 子 识别 数 


感知 器 
杠杆 点 

刚性 微分 方程 
供 信和 能 力 
KERE 


multiresolution analy 


multiresolution signal decomposition, MRSD 
bolycycle aromatic hydrocarbons, PAH 
multivariate resolution 

multivariate calibration 


multiple linear regression 
E 
second-order saturated D-opumal design 


F 


#-isher distributions 
F-test 

Fisher discrimination 
Fourier transformation 
range scaling 

analysis of variance 
variance squares method 
square matrix 
heterogeneity 
non-singular matrix 


non-linear analytical systems 


nonlinear iterative partial least squares, NIPALS 


resolution 

distribution 

stratified sampling 

segregation 

partitioned matrices 

figures of merit of analytical chemistry 
analytical signal 


analytical information theory 


analyte-internal reference correlated method. AIRCM 


molecular structure editor 
molecular connectivity index 
molecular topological index 
molecular graph 


molecular identification number 
G 


perceptron 
leverage point 

stiff differential equations 
information power 


conjugated effect 


Fed BE 
AA 
Gy 理论 


固定 尺 十 移动 窗口 渐进 因子 分 析 法 


光谱 多 重 性 效益 

广度 优先 搜索 
广义 肉 标 法 

To xad 

广义 铁 消失 由 和子 分 析 法 
Wa г 


Hadamard ж fe 
Hammett o 常数 
行列 式 

TRE 

TRE 

好 格子 点 法 
活性 函数 
HREH 
互信 息 

化 学 模式 识别 
化 学 专家 系统 
化 学 知识 系统 
(ee E ER БОТ 
回归 距离 和 
园 归 项 点 点 价 
aw 
混合 同 余 法 

温 料 试验 设计 


BAUR 
计算 机 数字 模拟 法 
计量 抽样 检验 

计数 抽样 检验 

基于 数论 方法 的 序 贯 优化 法 
加 权 最 小 二 乘 回 归 法 
交叉 校 验 法 

交叉 效应 

交互 效应 表 

检测 限 
简易 分 类 算 波 

间接 校正 方法 


= 
P 
E 


conjagate gradient 

confounded 

Gy's theory 

fix-sized moving window evolving factor analysis 
multichannel advantage in spectroscopy 
breadth-first search 

generalized internal reference method 
generalized inverse 

generalized rank annihilanon factor analysis 


momentum factor 
H 


Hadamard transformation 
Hammett 2 constant 
determinant 

row full rank 

row vector 

good lattice point 

activation function 

loadings matrix 

mutual information 
chemical pattern recognition 
chemical expert system 
chemical knowledge-based system 
chemical oscillating reaction 
regressive distance sums 
regressive vertex degrees 
back track 

mixed congruential method 


mixture experiment design 


J 


maximum likelihood estimator 
computer numerical simulation 
amounting sample test 

numbering sample test 

sequential number-theoretic optimization method 
weighted least squares regression 
cross-validation, 

interactive effect 

interaction effect tahles 

detection limit 

simple classification algorithm, SIMCA 


indirect calibration methods 
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渐进 因子 分 析 法 evolving factor analysis 
结构 图 structural or constitutional graph 
结构 解析 elucidation of strueture 
结构 主干 structure backbone 
经 典 诊断 方法 classic diagnostic methods 
局 部 顶点 不 变数 local vertex invariants. LOVT's 
局 部 优化 算法 loca] optimal method 
局 部 曲线 拟 合 法 local curve fitting method 
局 部 因子 分 析 local factor analysis 
句法 模式 识别 技术 syntactic pattern recognition 
REDE clustering analysis 
距离 判别 法 distance discrimination method 
矩阵 校正 方法 matrix calibration method 
年 阵 的 秩 rank of matrix 
矩阵 分 辩 方 法 matrix resolution method 
T8 PE BUE trace of matrix 
矩阵 matrix 
基于 全 局 寻 优 的 聚 类 法 clustering method based on global optimization 
AH ERBE degeneracy 
BR convolution 
385] 4r p B8 Ph OL C quasi-random number of uniform distribution 
均匀 设计 uniform experimental design 
均匀 设计 表 uniform design table 
Bt homogeneity 
均匀 性 准则 criterion for uniformity 
K 
К-ж К matrix method 
K-BHl ЖЖ K-means clustering method 
天 -最 近邻 法 K-nearest neighbor classification method, K-NN 
Kalman 滤波 Kalman filtering 
Kalman 增益 Kalman gain 
颗粒 性 质 因子 particle property factor 
PJ BE BE equivocation 
可 接受 质量 水 平 acceptable quality level 
可 变 类 平均 法 variable class average method 
可 变法 variable method 
可 靠 性 分 析 reliability analysis 
控制 -推理 器 模块 controller-reasoner 
快速 Fourier 变换 Íast fourier transform, FFT 
L 
拉丁 方 latin square 


类 平均 法 class average method 


LES 
BE Fourier 变换 
离散 小 波 变换 
粒状 物质 
立体 效应 常数 
连接 函数 
链 项 

ARE 
BRE 
PRERE 
临界 水 平 值 
Манж 
岭 迹 图 
RRE 
龙 格 - 库 塔 法 
逻辑 表达 

路 径 项 
16/81 


M 合计 法 
BREK 

帽子 矩阵 
BERR 
FFER 

模 

Bae 

模拟 退火 法 
模式 空间 
模式 空间 的 距离 
Monte Carlo 模拟 
Moore-Penrose 3 
目标 

目标 引导 


RE 

内 标 法 

内 部 相关 

内 积 

拟 水 平均 匀 设 计 
逆向 推理 
DEL 

牛顿 法 


dispersion matrix 

discrete Fourier transform. DFT 
discrete wavelet translormatiom 
granular material 

steric effect parameters 
connectivity function 

chain terms 

column vector 

colutan full rank 

adjacency matrix 

transition level 

ridge regression 

ridge trace plot 

sensitivity 

Range-Kutta method 

logical expressing 

path terms 


path ‘cluster terms 


Mahalanobis distance 
hat matrix 

blind search 

idempotent matrix 
norm 

fuzzy clustering method 
simulated annealing method 
pattern space 

distance in pattern space 
Monte Carlo simulation 
Moore-Penrose inverse 
object 


goal-directed 
N 


nat 

internal reference method, IRM 
inner relation 

inner product 

pseudo-level design 

inverse reasoning 

inverse matrix 


Newton method 
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о 
KR Euclidean distance 
Р 
站 -矩阵 法 P-matrix method 
判别 分 析 法 discrimination method 
FR discrimination plane 
批 不 合格 蝇 百 分 数 的 允许 界限 lot tolerance percent defective 
LE discrepancy; deviauon 
RE biases 
偏 最 小 一 乘法 partial least squares 
偏 最 小 二 乘 的 投影 判别 法 Projection discrimination based on PLS 
平滑 方法 Smooth method 
平移 sbifr or translation 
Powell 法 Powell method 
Q 
奇异 矩阵 singular matrix 
奇异 值 分 解法 single value decomposition, SVD 
启发 式 分 类 heuristic classification 
局 发 式 搜索 heuristic search 
前 传 网 络 误差 反 传 算法 back-propagation, BP 
取代 基 substituent 
取代 基 电 子 效应 常数 substituent electronic effect constant 
全 局 优化 算法 global optimal method 
全 局 因子 分 析 法 global factor analysis 
R 
Randic 分 支 指数 Randic hranch index 
人 工 神经 网 络 artificial neural network 
人 工 神经 网 络 判 别 法 diserimination based on artificial neural nerwork 
ALB ft artificial intelligence 
JURE B. redundancy 
S 
SIMCA 分 类 法 SIMCA classification 
> 型 非 线性 函数 sigmoid nonlinearity funcrion 
Lj] entropy 
BE divergence 
神经 纤维 nerve fibres 
神经 元 meuron 
кш ж depth-first search 


识别 率 recognition ratio 


矢量 

矢量 校正 方法 

释放 因子 

四 分 之 -因子 设计 法 
RRA HE 
RRM я 

双 线 性 矩阵 
数据 库 管理 模块 
数据 推动 
数据 预 处 理 

数据 专家 模块 

数字 模拟 方法 
搜索 树 
RRB EH MEH 
顺序 秩 分 析 方 法 
随机 变量 的 狐 值 特征 
随机 采样 

ШИА 

随机 变量 

所 有 顶点 的 划 方 距离 指标 


二 检验 

ШЕШ 

塔 式 算法 
台 劳 级 数 法 

梯度 法 

жй 

特征 抽取 方法 

特征 空间 

特征 矢量 

特征 投影 的 模式 识别 方法 
特征 值 

统 -与 线性 多 元 分 析 
同名 或 别名 

通用 标准 加 入 法 
投影 算法 
投影 寻 踪 法 

投影 指标 
投影 寻 踪 回归 
投影 寻 踪 分 类 
投影 寻 踪 密度 估计 
投影 旋转 因子 分 析 法 
投影 阵 


vector 

vector calibration metnod 

liberation factor 

quarter-fraction factorial design 
potential function discrimination 
residual standard deviation. RSD 
Ыраг matrix 

librarian 

data driven 

data preprocessing 

data expert 

digital simulation 

searching tree 

Schultz molecular topological indices 
sequential rank analysis 

numerical feature of random variable 
random sampling 

random events 

random variable 


mean-square distance between all vertexes 
T 


test 

t-distribution 

pyramid algorithm 

taylor series method 

gradient method 

condiuonal entropy 

feature extraction 

feature space 

eigenvector 

pattern recognition by latent projection 
eigenvalue 

statistical isolinear multiple component analysis, SIMCA 
alias 

generalized standard addition method 
projection algorithm 

projection pursuit 

projection index 

projection pursuit regression 
projection pursuit classification 
projection pursuit density estimation 
projection rotation factor analysis 


projection matrix 
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突 触 
图 像 处 理 
HERS ЗЕ Щ AE BY 


Wiener 拓扑 数 
Л: 15-4 
稳健 校正 
稳健 主 成 分 回归 


稳健 诊断 方法 
BRER 
稳健 主 成 分 分 析 
稳健 奇异 值 分 解法 
无 监督 的 模式 识别 


系统 采样 
RR 
线性 比率 内 标 法 
线性 不 相关 
线性 相关 

线性 自由 能 
线性 自由 能 关系 
线性 图 
线性 学 习 机 
线性 判别 函数 渤 
线性 组 合 设计 
限制 发 生 器 
相似 性 

响应 值 
DERB 

小 波多 分 辨 变换 
小 波 域 

XER 


选择 性 
BE tit E 


样本 


dendrirtes 
image processing 


ellipsoidal multivariate trimming. МУЛ 
w 


Wiener topological index 

quasi-random number 

robust calibration 

robust principal component regression 
robust partial least squares 

robust diagnostic method 

robust distance 

robust principal component analysis, RECA 
robust single value decomposition, RSV 


unsupervised pattern recognition 


systematic sampling 

hierarchical clustering method 

line ratio internal reference method, LRIRM 
linearly independent 

linearly dependent 

linear free-energy 

linear free-energy relationship 

linear graph 

linear learning machine 

linear discrimination function method 
linear combinatorial design 
constrained generator. CONGEN 
sumilarity 

response 

wavelet function 

wavelet multiresolution transformation 
wavelet domain 

agonist 

channel capacity 

information content 

information profitability 
signal-to-noise ratio, SNR 
selectivity 


student Distribution statistics 
Y 


sample 


样本 对 象 
KRH Du 
一 点 设计 


RRA 
遗传 算法 

雪子 分 析 
因子 分 析 的 误差 理论 
因子 设计 

AF Et BER 
隐藏 层 

BAH 

有 机 反应 性 相关 分 析 
有 监督 的 模式 识别 
有 监督 的 学 习 

有 偏 估 计 方 法 

有 限 总 体 校正 

诱导 效应 

与 /或 图 

BÀ 

预测 率 
语义 网 络 表达 

原子 质量 单位 
约束 背景 双 线 考分 解 


杂 散 噪声 

Kat 

жалан 

张 量 校正 理论 

直观 推导 式 演进 特征 投影 法 
直接 校正 方法 
HARA 

知识 表达 

秩 消失 因子 分 析 法 
正定 

正 交 设计 

正 交 设计 表 

正 交 投影 阵 

正 交 投影 分 辨 法 

正 态 分 布 的 伪 随 机 数 
EBSA 

EZE 

正 交 性 


object 

first-order saturated D-optimal design 
single point design 

one divided in two method 

first order predicate logic, FOPL. 
genetic algorithm 

factor analysis 

error theory of factor analysis 
factorial design 

resolution of factorial design 
hidden layer 

hydrogen-depleted graph 
correlation analysis of organie reactivity 
supervised pattern recognition 
supervised learning 

biased estimating method 

finite population correction 
inducing effect 

AND/OR-graph 

threshold 

prediction ratio 

semantic net expressing 

atom mass unit. AMU 


constrained background bilinearization 
z 


shot noise 

tensor 

tensor rosolution method 

tensor calihration theory 

heuristic evolving latent projections 
direct calibration method 

imbedded error 

knowledge expressin 

rank annihilation factor analysts 
positive definite 

orthogonal design 

orthogonal arrays 

orthogonal projection matrix 
orthogonal projection resolution 
quasi-random numbers of normal distribution 
normal distrihutions 

orthogonal matrix 


orthogonality 
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RE oscillation 

诊断 方法 diagnostic methods 

“钟乳石 图 ” stalactite plot 

真实 误差 real error, RE 

中 间距 离 法 medium distance method 

中 位 数 median 

重心 法 gravity center method 

主 成 分 回归 法 principal component regression 
主 成 分 投影 判别 法 projection discrimmation based on PCA 
主 效应 main effect 

主轴 primary axes 

逐步 判别 分 析 法 stepwise discrimination method 
ш transpose 

子 窗口 因子 分 析 法 subwindow faetor analysis 
子 空间 subspace 

自 标 度 化 autoscaling 

自 适应 Kalman 滤波 法 adaptive Kalman filtering 

自 适应 线性 元 adalnei 

自 模式 曲线 分 辨 法 self: modeling curve resolution 
EE Zi blocker 

组 成 因子 composition factor 

最 长 距离 法 maximum distance method 
RERE minimum distance method 
最 小 采样 数目 minimum number of samples 
最 小 体积 椭 球 估计 minimum volume eilipsoid estimates, MVE 
最 小 中 位 平方 法 least median of squares 

最 小 修剪 平方 法 least trimmed squares 

最 小 一 乘法 least absolute residuals 

最 小 生成 树 minimun spanning tree 

最 优 试 验 设计 optimal design 

坐标 轮换 法 coordinate changing method 
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A 吸光 度 

at ЖЕРЕ А ENS” ИА 8k Moore-Penrose Ж 

A. B. C, 和 矩阵 

AS BS C om EE 

a, by e, =" 小 写 黑体 字母 为 列 矢量 

d, MEN GRE 

Apa (Xo BEBE A. MER A FUE РЕТ! 
1 单位 矩阵 

1 所 有 分 量 缘 为 1 的 列 矢 量 

0 所 有 分 量 此 为 0 的 列 矢 量 


det (4) A BHIR 


